Data Engineering

Білім беру бағдарламасы: «Data Engineering»

Дайындық бағыты: ғылыми-педагогикалық
Оқу мерзімі: 2 жылдық оқу
«Цифлық инженерия және деректерді талдау» ғылыми-білім беру департаменті Data Engineeringмамандығы бойынша магистратураға түсуге ниет білдірген студенттер үшін бірегей білім беру бағдарламасын ұсынады.
Data Engineering дегеніміз не?

Data Engineering(деректер инженериясы) - бұл дата-аналитик және дата-саентист гибридінің бір түрі. Деректер инженері, әдетте, деректердің сенімді инфрақұрылымын қамтамасыз етуге, жұмыс процестерін, өңдеу конвейірлерін және ETL процестерін басқаруға жауап береді. Осы функциялардың маңыздылығына байланысты қазіргі уақытта белсенді дамып, сұранысқа ие болып келе жатқан танымал мамандық.
Жоғары жалақы мен үлкен сұраныс бұл жұмысты өте тартымды ететін бөліктің аз ғана бөлшегі!

Деректер инженериясы деректермен байланысты, атап айтқандаоларды жеткізу, сақтау және өңдеу. Егер қажеттіліктер иерархиясын қарастыратын болсақ, деректерді жобалау алғашқы 2-3 кезеңді алады: деректерді жинау, жылжыту және сақтау, дайындау
Деректер инженері не істейді?

Үлкен мәліметтердің пайда болуымен жауапкершілік саласы күрт өзгерді. Егер бұрын сарапшылар үлкен SQL сұрауларын жазып, деректерді Informatica ETL, Pentaho ETL, Talend сияқты құралдардың көмегімен іске асырса, енді дата-инженерлерге қойылатын талаптар жоғарылады.
Осылайша, дата - инженер мамандығының рөлі айтарлықтай зор.

Деректер инженері лауазымына қойылатын талаптар:
- Үлкен деректермен жұмыс тәжірибесі: Hadoop, Spark, Kafka.
- Алгоритмдер мен деректер құрылымын білу.
- SQL және Python, Java / Scala бағдарламаларымен үздік жұмыс жасай білу.
- Бұлтты платформалармен, атап айтқанда Amazon Веб-қызметтерімен жұмыс жасау тәжірибесі
- SQL және NoSQL деректер базаларын жақсы түсіну (деректерді модельдеу, деректерді сақтау).
- Таратылған жүйелердің негіздерін түсіну.
- Tableau немесе ElasticSearch сияқты деректерді визуалдау құралдарымен жұмыс тәжірибесі.

Дата инженерлері бағдарламалық жасақтаманы әзірлеу және сақтау саласының мамандары болып табылады. Егер компания әртүрлі дереккөздерден үлкен көлемде деректерді шығара бастаса, дата-инженердің міндеті - ақпарат жинауды, оны өңдеуді және сақтауды ұйымдастыру.
Дата-өнім - бұл деректерді бизнеске пайда әкелетін сапалы ақпаратқа айналдырудың нәтижесі.
Деректер инженері деректер зерттеушісіне қарағанда көбірек сұранысқа ие ме?

Деректер инженері болмаса прототиптік модельдің мәні төмен болады, себебі ол көбінесе дата-саентистен алынған және қандай да бір жолмен нәтиже беретін Python файлындағы сапасы нашар кодтар үзіндісінен тұрады.
Деректер инженері болмаса, бұл код ешқашан жобаға айналмайды және ешқандай бизнес мәселесі тиімді шешілмейді.
Оқытылатын пәндер атауы:

· Python бағдарламалау тілі (Деректер туралы ғылымға кіріспе)
· Кеңейтілген статистика
· Қолданбалы Машиналық оқыту
· Үлкен деректерді талдау
· Деректермен жұмыс және дизайн
· Терең оқыту және жасанды интеллект
· Қолданбалы компьютерлік көзқарас
· Hadoop таратылған жүйелері
· Масштабты шешімдер
· DevOps кіріспесі
· DWH модернизациясы
· Жоғары жүктеме қосымшаларын әзірлеу
· Алаяқтық пен аномалияны анықтау
· Деректерге негізделген басқару
· Деректер көлінің құрылысы
· Тереңдетілген оқыту
Деректер инженерлерінің мансаптық мүмкіндіктері:
Data Engineering бағдарламасы бойынша даярланған магистрлер банктерде, инвестициялық, сақтандыру, телекоммуникация, сауда, өндірістік компанияларында; әр түрлі меншік формасындағы ұйымдарда; үлкен деректерді өңдеумен байланысты технологияларға және блокчейн технологиясына негізделген ақпараттық жүйелерді, интеллектуалды өнімдер мен сервистерді әзірлеуді және пайдалануды жүзеге асыратын индустрия мен бизнес саласында да қызмет атқара алады.

· Data Engineer (деректерді жинайды және өңдейді, процестерді іске қосады және осы деректерді деректер өніміне айналдыру үшін қызметтер жасайды)
· Data Platform Engineer (платформалар дайындайды: инфрақұрылым, инженерия, қауіпсіздік және бақылау)
· Data Quality Engineer(инженерлік тапсырмаларды, деректерді талдауды және тестілеу элементтерін біріктіреді; дәстүрлі QA тестілеуден кең)
· Data DevOps Engineer (үлестірілген жүйелермен жұмыс істейді, қозғалмалы бөліктері көп ортада параллельді күрделі деректерді өңдейді, жүйе компоненттері арасындағы көптеген байланыстарды есте ұстап, мәселелерді талдайды және шешеді)
· Data Science Engineer (деректердің көп мөлшерін құрылымдайды және талдайды,болжамдар жасайды)
· Search Engineer (Search Engineer деректер сараптамасына жатады, өйткені қазіргі кезде іздеу жүйесі өте ақылды болды, енді ол басқа пәндерге қарағанда Data Science және мәліметтермен жұмыс істеуге әлдеқайда жақын)
· ML Engineer (Machine Learning - бұл Data Platform Engineerring-тің ерекше бөлігі, бұнда мәліметтермен жұмыс жасау ғана емес, сонымен қатар ML өнімнің өмірлік циклінің анықтығы мен басқарылуын қамтамасыз ету қажет; бұл процестің күрделілігіне байланысты ML инженер тереңірек тәжірибелік талдау жұмысын жасау керек)

Оқуға қалай түсуге болады