Предсказание количества лайков. Сравнение несколько регрессионных алгоритмов.

В начале апреля я узнал о суперкрутом конкурсе SNA Hackaton. К сожалению, узнал я лишь за неделю, но и для того, чтобы принять в нём участие, надо было доделать более важные дела. Суть конкурса в том, что участникам выдавался небольшой (~500 МБ) набор данных, содержащий текст поста в Одноклассниках, его время, идентификатор и идентификатор группы, а также собранные им лайки.

Надо было построить такой алгоритм, который лучше всего предскажет количество лайков, которое наберёт какой-либо другой пост. Это вполне возможно сделать, обучив алгоритм на имеющихся данных, потому что вся необходимая информация уже есть в них. Как оказалось потом, на количество лайков влияет длина поста, его содержание, наличие фотографий и другие параметры.

Честно сказать, результатом пары бессонных ночей я доволен и не доволен одновременно. С одной стороны, хочется сказать спасибо организаторам за то, что дали такую прекрасную возможность проанализировать данные и построить и проверить все эти гипотезы. Благодаря этому конкурсу я немного больше узнал про SciKit-learn и NLP (Natural Language Processing, а не то, что вы подумали). Но с другой стороны, у меня появилось желание получить модель получше, которое я пока, к сожалению, не реализовал.

Поскольку блог сжимает оригинальный html файл, посмотреть результаты исследования можно и с нормальной версткой.

В общем, конкурс уже закончился, у участников, которые оказались в топе значение итоговой метрики R^2 оказалось порядка 0.3, что очень хорошо, потому что мне на обучающей выборке удалось получить только порядка 0.2 (а это только обучающая выборка).

Как обычно, я выложил отдельно ipynb файл для тех, кто захочет повторить мои вычисления и разобраться сам.

107 thoughts on “Предсказание количества лайков. Сравнение несколько регрессионных алгоритмов.

  1. Pingback: free pussy finder
  2. Pingback: visit the page
  3. Pingback: go to the source
  4. Pingback: link to the page
  5. Pingback: go
  6. Pingback: link to details
  7. Pingback: see more
  8. Pingback: click to continue
  9. Pingback: notehub.org
  10. Pingback: more info
  11. Pingback: find out more here
  12. Pingback: notehub.org
  13. Pingback: notehub.org
  14. Pingback: find out more
  15. Pingback: address
  16. Pingback: notehub.org
  17. Pingback: notehub.org
  18. Pingback: notehub.org
  19. Pingback: click to go
  20. Pingback: follow this post
  21. Pingback: notehub.org
  22. Pingback: notehub.org
  23. Pingback: address
  24. Pingback: notehub.org
  25. Pingback: notehub.org
  26. Pingback: d2a20854899.com
  27. Pingback: topfuckgals.mobi
  28. Pingback: fastfuckse.mobi
  29. Pingback: bestslutspics.mobi
  30. Pingback: bestslutspics.mobi
  31. Pingback: 292uaQuyusm
  32. Pingback: hdmobilesex.me
  33. Pingback: pronbestrank.mobi
  34. Pingback: pronvipse.mobi
  35. Pingback: provided link
  36. Pingback: as reported here
  37. Pingback: read article
  38. Pingback: topsexportal.mobi
  39. Pingback: follow this post
  40. Pingback: on this page
  41. Pingback: read article
  42. Pingback: ABrand
  43. Pingback: 2019
  44. Pingback: cleantalkorg2.ru
  45. Pingback: #macron #Lassalle
  46. Pingback: a2019-2020
  47. Pingback: facebook
  48. Pingback: facebook1
  49. Pingback: javsearch.mobi
  50. Pingback: free bitcoin cash

Comments are closed.