in Data Science

10 вещей, которые говорят о том, что ты занимаешься анализом данных

10. Обычно ты думаешь «Как же много данных, так мало памяти».
9. Ты знаешь, что такое гетероскедастичность.
8. Ты знаешь вероятность того, что пойдёт дождь лучше синоптиков.
7. Обычно ты смотришь на свой чек в магазине, пытаясь предсказать, что ты купишь в следующий раз, основываясь на статистике.
6. Ты считаешь, что анализ данных это круто, и ты даже сформулировал теорему, чтобы это доказать.
5. После 3х часов ночи, цифры иногда отвечают на твои вопросы. Вслух.
4. Когда ты ночью считаешь овец, чтобы уснуть, ты не можешь уснуть.
3. Ты догадываешься, где спрятаны скрытые закономерности.
2. В субботней утро у тебя начинается похмелье Шапиро-Уилка.
1. Ты можешь улучшить эффективность любого процесса, просто взяв статистику за последний год и проведя 10 минут в консоли питона.

Кстати, гетероскедастичность — это когда ошибки в случайном процессе обладают разной и непостоянной дисперсией. В этом случае оценки параметров модели смещаются, становятся несостоятельными, и вообщ получается, что нельзя нормально использовать так любимый нами МНК. Поэтому перед построением какой-либо модели проявляется условие гомоскедастичности, для чего даже умные люди придумали специальные критерии.

  • Спасибо за пост. Давно не встречал публикаций читая, которые чувствуешь себя необразованным)))

    • playittodeath

      да пожалуйста) посмотри архив по дата майнингу, там есть ещё интересные статьи) ну и на рассылку рекомендую подписаться, я стараюсь каждый день писать.