in Data Science

Пару месяцев назад мне пришла в голову идея, что не обязательно узнавать все новости от друзей. Ведь потратив некоторое количество времени, можно просто-напросто собирать все фотографии, которые люди выкладывают в каком-то определённом месте. Сказано — сделано и скрипт начал собирать все фоточки, которые выкладывают люди на Красном 22, в кальянной Серёжи SmokeHouse и в Академпарке. В Академпарке кстати, никаких интересных фотографий не было. Видимо резиденты не слишком любят инстаграм.

Неожиданным бонусом оказалось, что настроив сбор фотографий с SmokeHouse я зацепил часть фотографий, которые делались в Hiltonе. В большинстве своём это всякие занудные конференции, но попались и отменные селфи в бассейне.

Забив себе голову этой идеей я не мог не настроить сбор фотографий с моего любимого здания в Новосибирске — Красного 22. Здания, которое — больше, чем просто постройка из кирпича. Здание, в котором я жил летом, которое объединяет добрую половину Новосибирска, начиная от работников администрации, заканчивая хипстерами. То, что происходит на Красном 22 в полной мере отражает то, что происходит в городе.

Конечно, за месяц накопилось достаточное количество фотографий, например, для Красного 22 я собрал больше 2 тысяч фотографий. Процентов 50 при ручном проходе я удалил, осталось около 1к фотографий. Среди удалённых оказались всякие рекламные сообщения, фото еды и всякие неинтересные моменты вкупе с неудачными фотографиями.

Но не смотря на всё это, большая часть отображает то, как люди проводят своё время. Так что находясь за 5000км я всё равно в курсе того, как весело пить во Френдс, как где меняется меню, кто с кем пьёт и отдыхает. Как будто и не уезжал. Кстати, очень порадовало большое количество целующихся пар)

Если думаете, что надо продолжить публиковать эти автоматические фотоотчёты, дайте знать в комментариях).

Автоматические фотоотчёты из инстаграма

SmokeHouse

Бонусные фоточки с Хилтона

Hilton

Lobby

 

Во Френдсе было много фоток, поэтому под сполйером они разбиты на временные категории.

Friends

C начала февраля

C середины февраля

C конца февраля

C начала марта

C середины марта

C конца марта

Chashka

Chop-Chop

Peoples

Outdoor


Селфи, на которых нельзя опознать место, также набралось достаточно. Поэтому они также разбиты на категории.

Сэлфи на Красном-22

С начала февраля

С середины февраля

С конца февраля

С начала марта

С середины марта

С конца марта

Ну и немного технических подробностей про оформление поста.

Для SmokeHouse хотел сначала сделать доступными и комментарии к фоткам, переименовав их при помощи небольшого скрипта на PowerShell (представьте, в Windows всё-таки можно сделать это одно строчкой):

Dir | Rename-Item –NewName { $_.name –replace “ “,”_” }

но потом забил, потому что достали тупые смайлики.

Фотки для Френдса и Самошотов сортировал просто по 10 дней find’ом уже на серваке:

$find ./ -maxdepth 1 -mtime +10 -exec mv "{}" ./03-middle/ \;