Gatsby
ΠΠΠ§ΠΠ«Π
Gatsby
ΠΠΠ§ΠΠ«Π
- Π Π΅Π³ΠΈΡΡΡΠ°ΡΠΈΡ
- 10 ΠΠΊΡ 2018
- Π‘ΠΎΠΎΠ±ΡΠ΅Π½ΠΈΡ
- 44,440
- ΠΠ°ΠΉΠΊΠΈ
- 204,369
ΠΠ²ΡΠΎΡ: BigData Π’eam
ΠΠ°Π·Π²Π°Π½ΠΈΠ΅: ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 3. RT, NoSQL, Data layout, Kafka (2023)

ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 3. RT, NoSQL, Data layout, Kafka [bigdata team]
ΠΡ Π½Π°ΡΡΠΈΡΠ΅ΡΡ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ ΠΏΠΎΡΠΎΠΊΠΎΠ²ΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΎΠΉ Π΄Π°Π½Π½ΡΡ , ΠΏΠΎΠ·Π½Π°ΠΊΠΎΠΌΠΈΡΠ΅ΡΡ Ρ Kafka ΠΈ Spark Structured Streaming, ΠΎΡΠ²ΠΎΠΈΡΠ΅ NoSQL ΠΏΠΎΠ²Π΅ΡΡ Π±ΠΎΠ»ΡΡΠΈΡ Π΄Π°Π½Π½ΡΡ , ΠΏΠΎΠ΄ΡΡΠΆΠΈΡΠ΅ Spark Ρ Cassandra.
Π ΡΡΠΎΠΌ ΠΌΠΎΠ΄ΡΠ»Π΅ Π²Ρ ΠΈΠ·ΡΡΠΈΡΠ΅:
Π‘ΠΊΠ°ΡΠ°ΡΡ:
ΠΠ°Π·Π²Π°Π½ΠΈΠ΅: ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 3. RT, NoSQL, Data layout, Kafka (2023)

ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 3. RT, NoSQL, Data layout, Kafka [bigdata team]
ΠΡ Π½Π°ΡΡΠΈΡΠ΅ΡΡ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ ΠΏΠΎΡΠΎΠΊΠΎΠ²ΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΎΠΉ Π΄Π°Π½Π½ΡΡ , ΠΏΠΎΠ·Π½Π°ΠΊΠΎΠΌΠΈΡΠ΅ΡΡ Ρ Kafka ΠΈ Spark Structured Streaming, ΠΎΡΠ²ΠΎΠΈΡΠ΅ NoSQL ΠΏΠΎΠ²Π΅ΡΡ Π±ΠΎΠ»ΡΡΠΈΡ Π΄Π°Π½Π½ΡΡ , ΠΏΠΎΠ΄ΡΡΠΆΠΈΡΠ΅ Spark Ρ Cassandra.
Π ΡΡΠΎΠΌ ΠΌΠΎΠ΄ΡΠ»Π΅ Π²Ρ ΠΈΠ·ΡΡΠΈΡΠ΅:
- ΠΏΠΎΠ΄Ρ ΠΎΠ΄Ρ ΠΊ Realtime-ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ΅;
- Π³Π°ΡΠ°Π½ΡΠΈΠΈ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ, ΠΏΠ΅ΡΠ΅Ρ ΠΎΠ΄ ΠΎΡ ΠΎΠ΄Π½ΠΎΠΉ Π³Π°ΡΠ°Π½ΡΠΈΠΈ ΠΊ Π΄ΡΡΠ³ΠΎΠΉ, Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΡ "ΠΡΠΌΠ±Π΄Π°" ΠΈ "ΠΠ°ΠΏΠΏΠ°";
- Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
- Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ° Kafka, Kafka Streams, ΡΠ΅ΠΏΠ»ΠΈΠΊΠ°ΡΠΈΡ Π² Kafka. ΠΡΠ»ΠΈΡΠΈΠ΅ Kafka ΠΎΡ ΠΊΠ»Π°ΡΡΠΈΡΠ΅ΡΠΊΠΈΡ ΠΎΡΠ΅ΡΠ΅Π΄Π΅ΠΉ;
- ΡΠ΅ΠΌΠ°Π½ΡΠΈΠΊΠΈ Π΄ΠΎΡΡΠ°Π²ΠΊΠΈ ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΠΉ, ΡΠΆΠ°ΡΠΈΠ΅ Π΄Π°Π½Π½ΡΡ Π² Kafka, ΡΠΈΠ½Ρ ΡΠΎΠ½Π½Π°Ρ ΠΈ Π°ΡΠΈΠ½Ρ ΡΠΎΠ½Π½Π°Ρ ΡΠ΅ΠΏΠ»ΠΈΠΊΠ°ΡΠΈΡ.
- ΠΎΡΠ»ΠΈΡΠΈΡ Key-Value Ρ ΡΠ°Π½ΠΈΠ»ΠΈΡ ΠΎΡ ΡΠ΅Π»ΡΡΠΈΠΎΠ½Π½ΡΡ ΠΠ;
- ΠΊΠΎΠΌΠΏΠ°ΠΊΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ ΠΈ Π΅Ρ Π²ΠΈΠ΄Ρ, CQLSH;
- Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ° Cassandra;
- ΠΎΠ±Π΅ΡΠΏΠ΅ΡΠ΅Π½ΠΈΠ΅ Π½Π°Π΄ΡΠΆΠ½ΠΎΡΡΠΈ ΠΈ Π²ΡΡΠΎΠΊΠΎΠ΄ΠΎΡΡΡΠΏΠ½ΠΎΡΡΠΈ Π² Key-Value Ρ ΡΠ°Π½ΠΈΠ»ΠΈΡΠ°Ρ ;
- ΠΈΠ½ΡΠ΅Π³ΡΠ°ΡΠΈΡ Spark Ρ Cassandra.
- ΠΊΠ°ΠΊ Π±ΠΎΡΠΎΡΡΡΡ Ρ Data Skew Ρ ΠΏΠΎΠΌΠΎΡΡΡ MapReduce ΠΏΠΎΠ΄Ρ ΠΎΠ΄ΠΎΠ² Π² ΡΠ°Π·Π½ΡΡ ΡΡΠ΅ΠΉΠΌΠ²ΠΎΡΠΊΠ°Ρ ;
- trade-off ΠΌΠ΅ΠΆΠ΄Ρ CPU ΠΈ IO-bound ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡΠΌΠΈ, ΠΏΠΎΠ΄Ρ ΠΎΠ΄Ρ ΠΊ ΡΠΆΠ°ΡΠΈΡ Π² Big Data, Π³ΠΎΡΡΡΠΈΠ΅ ΠΈ Ρ ΠΎΠ»ΠΎΠ΄Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅;
- ΡΠΎΡΠΌΠ°ΡΡ Π΄Π°Π½Π½ΡΡ Π² Big Data: ORC vs Parquet, Avro, ...
Π‘ΠΊΡΡΡΠΎΠ΅ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ΅ Π΄ΠΎΡΡΡΠΏΠ½ΠΎ Π΄Π»Ρ Π·Π°ΡΠ΅Π³ΠΈΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΡΡ
ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ!
Π‘ΠΊΠ°ΡΠ°ΡΡ:
ΠΠ»Ρ ΠΏΡΠΎΡΠΌΠΎΡΡΠ° ΡΠΊΡΡΡΠΎΠ³ΠΎ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ³ΠΎ Π²Ρ Π΄ΠΎΠ»ΠΆΠ½Ρ Π²ΠΎΠΉΡΠΈ ΠΈΠ»ΠΈ Π·Π°ΡΠ΅Π³ΠΈΡΡΡΠΈΡΠΎΠ²Π°ΡΡΡΡ.