Главная » Статьи » Data Science-дайджест: что почитать, посмотреть и попробовать в октябре

Data Science-дайджест: что почитать, посмотреть и попробовать в октябре

Что почитать

«Камень-ножницы-бумага», Datawrapper

Су-е-фа! Нет, не так… Цу-ли-фа! Или «Бу-ци-фа»? Думаем, вы уже догадались, о какой игре идёт речь. Александр Куликов, переводчик комиксов и автор подкаста «Девяностость», показал, как в разных регионах России играли в «Камень-ножницы-бумага». Варианты «Чин-гис-хан» и «Ван-чу-дэс» стали открытием даже для нас.

Data Science-дайджест: что почитать, посмотреть и попробовать в октябре

Варианты разнообразные. Если перейти по ссылке и навести мышку на регион, можно увидеть и его название, и название игры

«Как выглядит подводная оптическая сеть Земли», TJ

Данные не передаются по воздуху — это понимают все, но рассказать о том, как устроен интернет, мы едва ли можем. Эксперт по работе с данными Тайлер Морган-Уолл наглядно показал, как выглядит невидимая инфраструктура интернета со всеми подводными кабелями и их хитросплетениями. Исходный код визуализации можно найти на GitHub.

Всемирная паутина. Теперь и под водой

«OpenAI создала ИИ-модель для генерации выжимок из книг», vc.ru

Языковую модель GPT-3 научили сокращать художественные тексты без потери смысла. Сначала модель создаёт выжимку отдельных разделов книги, а затем сокращает и их. Так финальный пересказ «Алисы в Стране чудес» составил 136 слов против 26 000 в оригинале. По словам исследователей, в пересказах модели есть неточности, но общий смысл передан верно.

»6 графиков для сложных данных», SKVOT

Мы часто рассказываем о способах визуализации данных: их очень много, и каждый подходит отдельному типу информации. Анна Сидельникова показывает, как и где можно использовать ленточную и лепестковую диаграммы, для чего нужны тепловая карта и органиграмма, и в чём преимущества пузырьковых и фигурных диаграмм.

Data Science-дайджест: что почитать, посмотреть и попробовать в октябре

А ещё они анимированы и шевелятся для большей наглядности

«Великобритания заявила о планах стать сверхдержавой в области искусственного интеллекта», Inc.

Великобритания обнародовала Национальную стратегию в области искусственного интеллекта, которая будет направлена на развитие и интегрирование систем ИИ в различные сферы жизни. Программа призвана защитить национальные интересы и компании, многие из которых уже были выкуплены американскими или китайскими IT-гигантами.

«Google представила нейромодель Pathdreamer для ориентации в помещениях», Хабр

Google AI Research представили нейромодель Pathdreamer, которая генерирует изображения помещений с использованием ограниченных исходных данных и навигации. Благодаря модели вы можете «заглянуть за угол» и предположить, что вы увидите, переместившись в другое место.

Альманах ИИ

Центр компетенций НТИ регулярно выпускает Альманах «Искусственный интеллект»: в октябре вышел уже девятый выпуск! Он посвящён «железу» — аппаратному обеспечению, на котором строятся технологии машинного обучения. Авторы статей рассказывают о существующих процессорах и задачах, которые они решают, описывают весь стек программно-аппаратного обеспечения и выделяют ключевые компании России и мира.

«Как превратить текст в генеалогическое древо с помощью Python», Системный Блокъ

Разобраться в том, кем вам приходится «сваха племянника сестры мужа» довольно сложно: такие конструкции трудны для восприятия, а термины родства (например, «шурин» или «свояк») могут быть и вовсе не известны говорящим. Анна Голуб рассказывает об автоматическом анализе подобных конструкций и их представлении в виде генеалогического древа.

Data Science-дайджест: что почитать, посмотреть и попробовать в октябре

Немного программирования, и можно не путаться в степенях родства

«Peering into lunar permanently shadowed regions with deep learning», Nature

Учёные давно исследуют Луну и кажется, что о поверхности спутника им известно практически всё. Тем не менее, на фотографиях то и дело появляются новые артефакты. Нет, это не мистические образы, а всего лишь плохое разрешение или неудачный ракурс съёмки. Немецкие исследователи создали алгоритм для очистки неудачных снимков: его обучили на 70 000 фотографий тёмной стороны Луны. Алгоритм выявляет все незаметные кратеры и улучшает снимки до разрешения 1 метр на пиксель, что в 5 раз превосходит качество оригинальных снимков.

Опубликовано: 19 октября 2021
↓