Тема выпуска Как дата инженерам и аналитикам дружить?
В гостях у подкаста `Data Coffee` Игорь Мосягин — Data Engineer в шведской финтех компании Klarna (Twitter, Youtube, LinkedIn)
Shownotes:
0:49 Классический вопрос
3:06 Inverse podcast
7:13 Уровни data security
10:38 Технический стек
14:28 Взаимодействие с аналитиками
16:50 On-boarding
20:50 Аналитики и контроль
25:09 Про Redshift
27:11 Документация и её метрики
30:05 Философия про документацию
31:19 Выстраивание процесса on-boarding
34:45 Самомотивация и quantified self
39:35 Про PhD
50:03 Data catalogue
58:04 Мотивация преподавать
1:06:37 Вдохновение
Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_
Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями!
Shownotes:
2:56 A FOSS embeddable, transactional, relational-gr...
7:36 Уязвимость в Telegram для MacOS
13:07 Cyte.io A visual, searchable knowledge base of...
21:18 Typst - better then latex?
33:06 Европейский AI Act, если его примут, потребует..
33:39 Милый эмулятор древнего мака
38:39 Маководам попробовать какой-то модный тер...
53:38 Another terminal session recorder
Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_
Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями!
Shownotes:
5:30 Глобус, показывающий расположение спутников
6:38 Airflow 2.6
13:36 How to be minus 10x engineer
21:24 30 лет назад началась эра WWW
24:54 Arc from The Browser Company
32:48 OpenMetaData 1.0
39:49 Книга, написанная в соавторстве с нейросетью GPT-4
42:13 LLM as a backend
51:48 Уровень лития в грунтовых водах и здоровье
56:31 Кишечную микробиоту назвали фактором развития нервной анорексии
58:35 dbt 1.5
1:04:37 Java in AWS Lambda
Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_
Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
Тема выпуска Зачем писать свой Data Catalog
В гостях у подкаста `Data Coffee` Иван Канашов — Data Engineer в компании Тинькофф (GitHub, Telegram)
Shownotes:
0:47 Coffee
3:15 Зачем писать свой датакаталог
6:58 Модель данных каталога
9:08 Обновление данных в каталоге
17:40 Как говорить с бизнесом
21:03 Как решили идти в open source
23:37 Почему метаданные описывают не владельцы
25:20 Как понять, что каталог успешен
27:49 Lineage
29:59 Сколько времени ушло
31:49 Ролевая модель
35:13 Используется ли ML
37:23 Где посмотреть UI
40:18 Выйти и вернуться в IT
45:18 Каждый получает кайф там, где хочет
49:47 People & Data Governance
54:15 Будущее Data Governance систем
55:45 Что почитать и что поучить
Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_
Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями!
Shownotes:
3:58 Pycharm 2023.1
12:10 Snowflake plugin for vscode
22:04 Почему люди тупят после covid-19...
28:00 Pandas 2.0.0
35:59 Веселая кринжота
37:58 Сам нашел: две имплементации gpss
41:48 Илон маск зарегистрировал компанию в сфере иску...
42:19 Miller — утилита для работы с текстовыми данны...
52:23 Reddit сделает доступ к своему api платным — из...
54:19 Chatgpt, химия, индекс хирша и рафаэль луке
58:44 K8gpt to debug k8s
1:07:41 Chatgdb
1:11:06 Вспомнить все
Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_
Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat