Gatsby
ΠΠΠ§ΠΠ«Π
Gatsby
ΠΠΠ§ΠΠ«Π
- Π Π΅Π³ΠΈΡΡΡΠ°ΡΠΈΡ
- 10 ΠΠΊΡ 2018
- Π‘ΠΎΠΎΠ±ΡΠ΅Π½ΠΈΡ
- 44,464
- ΠΠ°ΠΉΠΊΠΈ
- 204,354
ΠΠ²ΡΠΎΡ: ΠigData Π’eam
ΠΠ°Π·Π²Π°Π½ΠΈΠ΅: ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 2. Spark: from zero to hero (2023)

ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 2. Spark: from zero to hero [bigdata team]
ΠΠ° ΠΏΡΠΎΡΡΠΆΠ΅Π½ΠΈΠΈ ΡΡΠΎΠΉ ΡΠ°ΡΡΠΈ ΠΊΡΡΡΠ° Π²Ρ Π±ΡΠ΄Π΅ΡΠ΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ ΡΠΎ Spark: ΠΎΡ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² ΠΈ RDD Π΄ΠΎ Spark DataFrames ΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΠΈ Spark Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ.
Π ΡΡΠΎΠΌ ΠΌΠΎΠ΄ΡΠ»Π΅ Π²Ρ ΠΈΠ·ΡΡΠΈΡΠ΅:
Π‘ΠΊΠ°ΡΠ°ΡΡ:
ΠΠ°Π·Π²Π°Π½ΠΈΠ΅: ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 2. Spark: from zero to hero (2023)

ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 2. Spark: from zero to hero [bigdata team]
ΠΠ° ΠΏΡΠΎΡΡΠΆΠ΅Π½ΠΈΠΈ ΡΡΠΎΠΉ ΡΠ°ΡΡΠΈ ΠΊΡΡΡΠ° Π²Ρ Π±ΡΠ΄Π΅ΡΠ΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ ΡΠΎ Spark: ΠΎΡ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² ΠΈ RDD Π΄ΠΎ Spark DataFrames ΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΠΈ Spark Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ.
Π ΡΡΠΎΠΌ ΠΌΠΎΠ΄ΡΠ»Π΅ Π²Ρ ΠΈΠ·ΡΡΠΈΡΠ΅:
- cΡ Π΅ΠΌΠ° Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ Π·Π°Π΄Π°ΡΠΈ Π² Spark;
- ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ ΡΠ΅ΡΠΌΠΈΠ½Ρ Spark (job, task, stage);
- ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ Π² Π²ΠΈΠ΄Π΅ Π³ΡΠ°ΡΠ°. Spark Python API. Spark RDD API;
- Broadcast-ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΡ ΠΈ ΡΡΠ΅ΡΡΠΈΠΊΠΈ.
- Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡΠ²ΠΈΠ΅ Hive ΠΈ Spark SQL;
- ΠΎΡΠ»ΠΈΡΠΈΡ DF ΠΎΡ RDD.
- Spark on YARN;
- ΡΠΈΠΏΡ stage Π² Spark;
- ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΡ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΈ shuffle;
- Π½Π°ΡΡΡΠΎΠΉΠΊΠ° Garbage Collection, ΡΡΠ½ΠΈΠ½Π³ ΠΏΠΎΡΡΠ΅Π±Π»Π΅Π½ΠΈΡ ΠΏΠ°ΠΌΡΡΠΈ.
Π‘ΠΊΡΡΡΠΎΠ΅ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ΅ Π΄ΠΎΡΡΡΠΏΠ½ΠΎ Π΄Π»Ρ Π·Π°ΡΠ΅Π³ΠΈΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΡΡ
ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ!
Π‘ΠΊΠ°ΡΠ°ΡΡ:
ΠΠ»Ρ ΠΏΡΠΎΡΠΌΠΎΡΡΠ° ΡΠΊΡΡΡΠΎΠ³ΠΎ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ³ΠΎ Π²Ρ Π΄ΠΎΠ»ΠΆΠ½Ρ Π²ΠΎΠΉΡΠΈ ΠΈΠ»ΠΈ Π·Π°ΡΠ΅Π³ΠΈΡΡΡΠΈΡΠΎΠ²Π°ΡΡΡΡ.