Создан концептуально новый рейтинг Твиттера

Создан концептуально новый рейтинг Твиттера

Наконец-то завершена разработка одной идеи, которая обитала в моей голове на протяжении последних полутора месяцев. Исправлены последние критические ошибки, доработаны различные мелочи, и я рад представить вам TwiRate.ru — концептуально новый рейтинг для Твиттера!

Начну издалека. Мысль о том, что неплохо бы создать рейтингующий каталог для русскоязычного сегмента Твиттера посещала меня давно. Действительно, это было бы очень удобно — прийти в одно место, где можно зафолловить всех интересных людей твоей тематики, не перебирая при этом гору мусора и "лытдыбров".

Проблема была одна — каким образом осуществлять ранжирование.

Упорядочивать по числу фолловеров? Нет, это никуда не годится, поскольку в ТОПе будут исключительно массфолловеры. Это очевидно и проверки не требовало.

Брать соотношение фолловеров к друзьям (followers к following)? Это ближе к теме, но все равно не то, поскольку существует нехитрая технология "отжимки" твиттер-аккаунта. Под "отжимкой" я подразумеваю следующий процесс:

  1. Массфолловим всех и вся;
  2. Удаляем тех, кто не зафолловил нас в ответ;
  3. Переходим к пункту 1.

Такой подход позволяет получить неплохое ратио (отношение фолловеров к друзьям), а значит довольно просто может стать предметом накрутки. Более того, насколько я знаю, уже существуют сервисы, занимающиеся подобной деятельностью (правда пока с применением ручного труда).

Ну а про число написанных твитов даже говорить не буду. Если сделать это основным параметром, наличие аккаунтов-роботов в ТОПе нам обеспечено.

Решение пришло как всегда неожиданно. Дело в том, что не так давно создатели Твиттера ввели в систему такую характеристику как listed (я называю это "членства"), то есть число списков, в которые наш аккаунт кем-то был добавлен. Проанализировав корреляцию этого параметра с популярностью довольно большой выборки аккаунтов, я пришел к выводу, что это — то что нужно.

Да, согласен, что этот параметр опять-таки неидеален, поскольку существует возможность накрутить и его. Но во-первых, сделать это сложнее, чем массфолловить, во-вторых он исчисляется как правило десятками (реже — сотнями), поэтому результат накрутки будет сразу заметен и может быть успешно пресечен. В третьих, если грамотно анализировать наряду с ним, несколько дополнительных параметров, то можно вполне добиться удовлетворительного ранжирования. Ну и не будем упускать из виду тот факт, что если накрутка этого параметра примет массовый характер, всегда можно дополнительно анализировать аккаунты, фигурирующие в параметре listed, на предмет их естественности.

Итак, ранжирование в рейтинге осуществляется по следующим параметрам (в порядке убывания значимости):

  • Число членств ("listed");
  • Число фолловеров ("followers");
  • Отношение фолловеров к друзьям (followers/followings);
  • Число твитов.

Помимо этого в алгоритм введены некоторые санкции, фильтры и бонусы, которые со временем будут усложняться и дорабатываться. Но уже сейчас рейтинг показывает достаточно адекватную картинку на той выборке, что у него имеется. Причем алгоритм успешно обрабатывает и такую ситуацию, когда аккаунт, вроде бы, массфолловерский, но тем не менее качественный. Например к такому типу относится твиттер Ленара Амирханова.

Обновление рейтинга происходит раз в сутки — в промежуток с полуночи до трех часов ночи. На текущий момент реализован тот минимум, который необходим для нормального функционирования рейтинга. Дальше будет еще интереснее, задумок по этому проекту у меня море морское. В том числе и на тему улучшения алгоритма ранжирования.

В качестве бонуса, у аккаунтов, добавленных в рейтинг, сервис будет вести историю изменения основных параметров — фолловеров, друзей, членств и рейтинга. Так что, вы всегда сможете "отмотать" историю и посмотреть на динамику развития вашего аккаунта, а также проанализировать взаимосвязь изменения параметров с вашими действиями по раскрутке. В дальнейщем планируется значительно расширение функционала сбора и анализа статистики.

Да, забыл сказать — я уже добавил ряд аккаунтов, которые читаю, в рейтинг. Так что проверяйте, может быть вы там уже присутствуете. А если нет, то не стесняйтесь добавляться, места хватит всем :). Кстати, если у вашего аккаунта довольно большое число членств (например, свыше сотни), то, пожалуйста, проявите терпение при добавлении в рейтинг. Подсчет числа членств — дело относительно небыстрое, из-за несовершенства API Твиттера.

Мне очень важно сейчас получить как можно больше отзывов, замечаний и пожеланий, поскольку сервису, несмотря на относительную завершенность, требуется свежий взгляд. Поэтому буду очень вам благодарен, если вы пропиарите этот пост у себя на блоге или в Твиттере — даже небольшое упоминание здорово поможет.

Жду ваших комментариев, друзья!

Если если вам понравилась эта статья, вы можете подписаться на материалы моего блога через rssRSS или emailemail, а также присоединиться ко мне в twitterTwitter.

Похожие публикации
Дата 11 января 2010 г. · Twitter
RSS подписка Комментарии (105 штук)
Gravatar Андрей Гусаров 12 января 2010 г. в 13:55 #
В целом на 100% согласен с рассуждениями! Сейчас рейтинги в основном массфоловинг рассматривают.
Gravatar Cuprum 12 января 2010 г. в 13:58 #
Можно еще добавить возраст аккаунта. Конечно, не основной параметр, но принимать во внимание стОит.
Gravatar Безумный Программист 12 января 2010 г. в 13:59 #
Так вот о каком сервисе Вы говорили в интервью :) Ну чтож, выглядит очень и очень хорошо, годик-другой и есть все шансы, что Google его купит :)

На мой взгляд определенно нехватает 1) Поиска по рейтингу. Как мне определить, есть я в нем, или еще нет? 2) Рубрики «Программирование». Себя я бы отнес именно в нее. 3) Возможности добавлять свои рубрики. Чтобы не напрягать администрацию :) 4) Объединив 1-3 я прихожу к выводу, что вместо рубрик можно было бы использовать фолксономию (метки) — это решило бы все бросившиеся мне в глаза проблемы.
Gravatar Алексей Московский 12 января 2010 г. в 14:02 #
Cuprum, отличная идея! Обязательно добавлю.

Безумный Программист,
1) Логично, можно добавить;
2) Есть «Разработка»;
3) Думаю, что напрягут всего несколько раз, все таки число тем ограничено;)
4) Думал об этом, но хочется строгости, чтобы раз — залез в категорию все.
Gravatar Steward 12 января 2010 г. в 14:04 #
Бредовые параметры отбора… точнее не бредовые — а очевидные, и значит никому не нужные.
Гораздо эффективнее было бы, с точки зрения адекватности вашего рейтинга, опираться на ретвиты и всякие via… если у человека 50 фоловеров и его сообщение отретвитили 45 из 50.. то этот человек популярнее чем массфоловер с 5000 которого отретвитили те же 45 человек… ну и чем большей глубине ретвит — тем больше его масса. Т.е. если это ретвит ретвита — то человек вместо одного виртуального балла получает 2… и чем больше степень ретвита тем больше баллов получает автор исходного сообщения.
Ну а число твитов учитывать в рейтинге (пусть даже в какой-то сложной формуле вместе с другими параметрами) — это тупой идиотский бред — разве что этому компоненту поставить самый низкий вес в формуле…. если число ретвитов например считать с весом 1 (ну и дальше по шкале) — то для количества твитов вес будет 0,01 — т.е. 1 ретвит равняется 100 твитам
Gravatar CyrilSavitsky 12 января 2010 г. в 14:05 #
Все хорошо, но есть conversationlist — лист, в котором показываются 25 последних собеседников. Это лазейка для ботов.
Gravatar Безумный Программист 12 января 2010 г. в 14:08 #
Кстати, а нельзя ли сделать также и jpg/png/gif-версию графика? У меня под FreeBSD трудности с Flash :)
Gravatar Алексей Московский 12 января 2010 г. в 14:10 #
Steward, пиши, пожалуйста, менее агрессивно — неприятно тебя читать.

По делу — возможно, рейтинг будет очитывать и число ретвитов, равно как и число mentions (упоминаний), но это в будущем, когда текущая модель не будет адекватно справляться с ранжированием.

И да, ты угадал — числу твитов, соответствует самый низкий коэффициент. Очень низкий. Но ведь если человек активно пользуется Твиттером, надо же это записать ему в плюс, верно?
Gravatar Алексей Московский 12 января 2010 г. в 14:11 #
CyrilSavitsky, спасибо, учту этот фактор тоже!

Безумный Программист, надо подумать, скорее всего делать придется:)
Gravatar Казанский татарин 12 января 2010 г. в 14:12 #
У твиботов может быть ооочень большое кол-во твитов и ооочень большое значение отношения followers/following, тем более если following=0 деление на ноль (можно можно) дает число близкое к бесконечности :D . Кстати, а можно как-то учитывать кроме простого обращения в никуда (т.е. кол-во твиттов) и кол-во реплаев и ретвитов твитов (уф) этого твиттерянина другими?
Gravatar CPU 12 января 2010 г. в 14:13 #
Первое впечатление положительное. Только, возможно, стоит расширить число тематик,(например, добавить «IT»). Иначе, раздел «Общетематические» быстро разбухнет. )
Gravatar Алексей Московский 12 января 2010 г. в 14:19 #
Казанский татарин, боты отдыхают, так как кол-во твитов и отношение друзей к фолловерам — величины второстепенные:) Насчет учета кол-ва реплаев и ретвитов, идея очень здравая, скорее всего её реализую!

CPU, да субкатегории видимо ввести придется. Займусь этим сегодня, когда буду анализировать добавленные аккаунты. Спасибо!
Gravatar Елена 12 января 2010 г. в 14:20 #
Кстати, неоднократно замечено — создаётся второй аккаунт, почти никого не фолловит, но ретвитит основной.
Вот внесла себя и сразу оказалась на первых местах — вчера был небольшой флешмоб, на самом деле такого не должно быть, хотя, всё верно — список мал.
Удачи :)
P.S.Нечаянно себя засунула в категорию СЕО (@Lassska), можно ли перенести в «общетематический»?
Gravatar SEOinSoul 12 января 2010 г. в 14:23 #
Мне рейтинг по душе — очень грамотная реализация. В будущем еще чуть-чуть расширить функционал и будет вообще золото. Действительно, интересная идея насчет подсчета ретвитов, причемв отношении к общему числу фоловеров — это реальный показатель качества!
Соответствующий раздел для меня есть, в рейтинге я уже есть — все нравится :)
Gravatar Алексей Московский 12 января 2010 г. в 14:38 #
Елена, да ситуацию со вторым аккаунтом тоже наблюдаю часто. Но тут уже все честно — пользователи добровольно, без массфолловерской тактики подписываются на первый аккаунт.
Ок, обязательно перенесу ближе к вечеру.

SEOinSoul, спасибо за отзыв! Такие фидбеки made my day:)
Gravatar CPU 12 января 2010 г. в 14:41 #
Вот я ещё несколько минут побаловался, присмотрелся, и скажу — СПАСИБО!!! Действительно очень хороший рейтинг! Теперь, найти интересных людей — стало в разы проще.
Gravatar Алексей Московский 12 января 2010 г. в 14:44 #
CPU, рад что понравилось!
Gravatar Андрей 12 января 2010 г. в 14:59 #
Важно для рейтинга русскоязычных твиттерян — сколько русскоязычных фолловеров в аккаунте. Можно писать только по-русски и зафолловить туеву кучу иностранцев, которые не знают русский. Это не показатель. Этот параметр тоже вкупе надо учитывать, как это учитывают на Tweem.ru
Gravatar Алексей Московский 12 января 2010 г. в 15:02 #
Андрей, справедливое замечание, надо будет реализовать! Спасибо!
Gravatar Елена 12 января 2010 г. в 15:03 #
Что-то не найду поиска. Завтра это будет самая актуальная строка:)
Gravatar Сергей М. 12 января 2010 г. в 15:04 #
Рейтинг неплохой, по крайней мере, кто-то задумался о нормальном механизме рейтингования (да и диз симпатичный), а не набыдлокодил за полчаса.
Gravatar Алексей Московский 12 января 2010 г. в 15:04 #
Елена, пока, в качестве заменителя, можно добавить себя еще раз — добавления не произойдет, а будет редирект на профиль:)
Gravatar Владимир 12 января 2010 г. в 15:11 #
Рейтинг хороший, пару рубрик бы добавить (свой новостно-музыкальный не знаю куда отнести)
Gravatar Алексей Московский 12 января 2010 г. в 15:15 #
Владимир, пока что можно в «Общетематический», а вечером я создам доп. категории, куда и перенесу твой аккаунт.
Gravatar Дмитрий 12 января 2010 г. в 15:36 #
Как поменять раздел, если указал не правильный?
Gravatar Bogdanmoscow 12 января 2010 г. в 15:37 #
К четырём параметрам ранжирования можно добавить пятый — частота твитов. Он сильно коррелируется с параметром listed, но, возможно, как-то еще уточнит позицию.
Gravatar Алексей Московский 12 января 2010 г. в 15:42 #
Дмитрий, напиши мне на alexkucherov@gmail.com c указанием аккаунта и предпочтиетельного раздела — я перенесу ближе к вечеру.
Gravatar Алексей Московский 12 января 2010 г. в 15:43 #
Bogdanmoscow, хорошая идея. К тому же нересурсоемкая. Спасибо!
Gravatar Инна Владимировна 12 января 2010 г. в 15:45 #
Перечитала все статьи и переписку и сделала вывод, что все это для узкого круга людей- профессионалов на спецязыке общающихся, а попроще, на родном — совсем нельзя? Вывод= больше поймут, больше подпишутся, больше скажут вам огромное спасибо за науку. Инва.
Gravatar ShutteR77 12 января 2010 г. в 15:47 #
Алексей, классный рейтинг! Очень понравился. Не стоит конечно полагаться на Twitter листы, но идея и ее реализация очень порадовала.
Что можно было бы добавить: можно отвести для всех корпоративных тви-аккаунтыов (например Google_ru) одну рубрику.
Так же было бы интересно добавить облако хеш тегов по интересам (их можно брать из bio пользователей). Затем можно (но думаю это уже из области фантастики) рейтинг на картах, то есть в каком регионе кого фоловят больше и так далее. В принципе информацию можно взять из geo api и из location, и прикрутить на mash-up google maps. Но думаю пока это не самая важная задача.
И н последок, думаю стоит пропиарить этот замечательный рейтинг на других тви посвященных ресурсах. У меня есть доступ к rutwitter.com (я там частенько публикуюсь и на хорошем счету). Могу попробовать кинуть о вас весть, если это конечно не убьет их собственный рейтинг :)
Удачи в продвижении!
Gravatar ShutteR77 12 января 2010 г. в 15:48 #
Оу да, еще есть предложение. Можно добавить поиск, что бы можно было найти себя в рейтинге. А то после 5 страницы уже не интересно листать, а статистику получать хочется.
Gravatar Алексей Труфанов 12 января 2010 г. в 15:49 #
Спасибо! Очень порадовало наличие рубрики «Разработка».

Теперь по алгоритму… Я думаю, следует учитывать не ОБЩЕЕ количество твитов (твиты + ответы + ретвиты), а ТОЛЬКО «ЧИСТЫЕ» твиты, либо учитывать и то и другое, но чтобы из двух твиттерян в рейтинге выше был тот, у кого больше «чистых» твитов.
Gravatar Алексей Московский 12 января 2010 г. в 15:59 #
Инна Владимировна, у меня специфическая аудитория, спецтермины здесь уместны.

ShutteR77, для корпоративных аккаунтов уже существуе отдельная рубрика «Сообщества». А в остальном — огромное спасибо, ты натолкнул меня на кучу интересных идей:) Если получится пропиарить этот рейтинг на рутвиттере буду очень благодарен!

Алексей Труфанов, пожалуйста, рад, что понравилось!

Насчет учета чистых твитов — это довольно спорный вопрос. Получается, что твит «привет всем!» будет «стоить» выше ретвита качественного материала? Кроме того, подсчитать число чистых твитов для каждого участника — это крайне ресурсоёмкая задача — некоторые аккаунты имеют свыше 20000 твитов!
Gravatar sMiles 12 января 2010 г. в 16:09 #
Неплохо было бы добавить раздел 'Культура и искусство« или »Хобби"
А то музыкальным твиттерянам некуда региться
Gravatar Алексей Московский 12 января 2010 г. в 16:11 #
sMiles, согласен, сегодня сделаю.
Gravatar podarok 12 января 2010 г. в 16:20 #
число твитов здесь неуместно, ибо твиты могут удаляться самим пользователем.
число ответов на твиты пользователя + число ретвитов твитов пользователя — вот довольно сильный показатель.
Я б его поставил вторым в списке автора статьи
Gravatar podarok 12 января 2010 г. в 16:23 #
И кстати.
На вершине вашего топа — массфоловер.
Видать есть дыра в расчетах логики.
Gravatar ShutteR77 12 января 2010 г. в 16:31 #
to podarok

Но все-таки я придерживаюсь мнения, что Козлов мас фоловер.
Gravatar ShutteR77 12 января 2010 г. в 16:32 #
oops, а цитата не встала
«» Причем алгоритм успешно обрабатывает и такую ситуацию, когда аккаунт, вроде бы, массфолловерский, но тем не менее качественный. «»
Gravatar DiVolk 12 января 2010 г. в 16:36 #
я видел аккаунты которые, занесены в 5-6 листов одного и того же пользователя, плюс в свои собственные листы :-). Зачем? хз…
Любой рейтинг вещь субъективная.
Идеальных рейтингов не существует, накрутить можно любой показатель и листы и ретвиты и ответы.
Повторял и буду повторять: Интернет это одна сплошная накрутка…
Gravatar Conceptmama 12 января 2010 г. в 16:36 #
Идея хорошая. Не хватает рубрики «Дом и семья» или что-то типа этого (для мам ;)
А также «Взаимоотношения» или «Он и она», для любителей sexymonday.
Gravatar DiVolk 12 января 2010 г. в 16:42 #
З.Ы. Не заморачивайся на накрутки, если это будет интересным, все равно накрутят. Сделай нечто ОРИГИНАЛЬНОЕ и будет тебе респект :-)
Gravatar Алексей Московский 12 января 2010 г. в 16:43 #
podarok, ShutteR77, да уж Евгений — однозначно персонаж неоднозначный:) Честно говоря не знаю, что сделать вэтой ситуации. Зафильтровать? Да нифига, он популярнее нас всех вместе взятых. Оставить в топе? Дык, массфолловер же! Хоть голосование устраивай:)

DiVolk, согласен по всем пунктам. Но это не повод опускать руки и пытаться хоть как-то упорядочить этот хаос, пусть и с какой-то долей погрешности.

Conceptmama, с категориями прямо беда какая-то:) Сегодня буду продумывать этот момент.
Gravatar Алексей Московский 12 января 2010 г. в 16:52 #
DiVolk, это верно, очередное соревнование пули и брони:)
Gravatar ShutteR77 12 января 2010 г. в 17:19 #
Алексей Московский, решать тебе.
Вообще, как мне кажется можно еще сделать фильтр на количество зафоловленных в день. Если это число больше 30 (ни кто столько не фоловит), то понижать статус пользователя. Но это думы пока.
Как я написал выше, решать тебе.
Еще в защиту нашего с podarok мения приведу такую ссылку — http://www.searchengines.ru/blog/archives/010016.html
Gravatar Алексей Московский 12 января 2010 г. в 17:26 #
ShutteR77, хорошая ссылка, сегодня буду продумывать алгоритм.
Насчет фильтра на количество зафоловленных в день — добавлю в планировщик. Этот метод пригодиться в борьбе с накрутчиками. Спасибо!
Gravatar niq 12 января 2010 г. в 17:37 #
По-моему из этого проекта в будущем может получиться офигенная конфетка! Может вам помощников подыскать, чтобы всех целей побыстрее достичь? :)

Поиск, конечно, было бы замечательно. Еще предлагаю добавить несколько фильтров в рейтинге, например, по региону.

А вообще, спасибо за ваш труд и удачи!
Gravatar prmen 12 января 2010 г. в 17:39 #
А в рейтинге только РУ-твиплы?
Если да — то как определяете? Или все вручную?
Gravatar Den Kutergin 12 января 2010 г. в 17:49 #
Отличный выбран вариант для ранжирования аккаунтов, давно планировал сделать для своего форума какой-то адекватный рейтинг, только все в планах остается. Пока буду наблюдать за вашим развитием)
Gravatar Андрей 12 января 2010 г. в 18:59 #
Надо бы добавить тему «Для женщин» — Дети, Семья, мода и т.д. и тему «Психология» — отношения, психология и т.д.
Gravatar Андрей 12 января 2010 г. в 19:05 #
И еще тема «Здоровье» — таких блогов много, и новости, возможно, отдельно
Gravatar Андрей 12 января 2010 г. в 19:38 #
А вы сосчитайте — сколько у Козлова русскоязычных фолловеров — не думаю, что более 2000 — сразу будет ясно. Но материал у него бывает интересный — надо отдать должное
Gravatar @pavel_gite 12 января 2010 г. в 19:43 #
Мне кажется присутствие пункта «кол-во твитов» бессмысленно.
Еслибы, определялось «качество твитов», это был бы совершенно другой разговор. Например по кол-во ретвитов на каждый твит.

Пример:
В твиттере регистрируется Путин, и он написал 3 записи и его зафоловило 10 000 и массфоловер с 40 000 + 1000 записей. Как вы думаете кто в рейтинге должен быть выше? Пусть даже этот массфоловер в твиттере уже два года.


Пример 2:
1 — пишет редко и качественно имеет 1000 фоловеров и 10 друзей
2 — пишет как дышит, пятьсотсемьдесятпять твиттов в день имеет 1000 фолловеров и 500 друзей
Кто должен быть выше?


Вывод.
На мой взгляд, либо параметр кол-во твиттов вообще исключить, либо поставить ему ничтожно малый вес 0.00001, либо попытаться подсчитывать качество твиттов.
Gravatar twitterrate 12 января 2010 г. в 19:45 #
О.о Конкуренция? :D Будем конкурировать, удачи.
Gravatar Андрей Гусаров 12 января 2010 г. в 19:48 #
Мне нравится, я добавил свой.
Gravatar CyrilSavitsky 12 января 2010 г. в 19:52 #
Алексей, кстати, ConversationList учитывать довольно просто. Поскольку он генерится автоматически, то все названия одинаковы. А, по большому счету, этот лист показывает интенсивность общения пользователя за последний период. Причем именно общения, в отличие от генерации траффика, которую дает количество твитов

Я бы при расчете рейтинга из категории списков все конверсейшнлисты исключал, но учитывал их количество отдельной составляющей с каким-то небольшим весом.

Кстати, для рейтингования я бы использовал не количество твитов (это монотонно возрастающая величина и она будет тянуть рейтинг вверх вне зависимости от того, продолжает пользователь активно писать или нет), а, например, количество твитов, нормированное на отношение промежутка, в который написаны последние сто (к примеру) твитов к общему времени существования аккаунта.

Получилось сумбурно, но, если будут вопросы, пиши — в Твиттер или на почту. ;-)
Gravatar Алексей Московский 12 января 2010 г. в 19:57 #
niq, спасибо за отзыв, буду думать!

prmen, либо РУ твиплы, либо твиплы пишущие на русском языке.

Андрей, согласен, с категориями нужно поработать как следует. Думаю, займусь этим сегодня.
Gravatar Artёm 12 января 2010 г. в 20:34 #
Спасибо, за вашу работу! Есть несколько мыслей по поводу рейтинга.
Во-первых, ранжирование. Количество списков, в которые занесён микроблог — хороший критерий, но так же подвержен накрутке (хоть и в меньшей степени), как и число читателей, ратио (об этом вы говорите в посте), а число твитов и дата создания аккаунта (критерий, предложенный в комментариях), на мой взгляд, мало о чём могут сказать. По моему мнению, ранжирование необходимо устроить примерно следующий образом (критерии в порядке убывания значимости):
- количество ссылок на микроблог
- отношение количества ретвитнутых твитов микроблога к общему количеству твитов
- количество реплаев
- количество ретвитов твитов микроблога
- количество листов, в которые включен микроблог
- отношение количества твитов микроблога, внесённых в favorites к общему количеству твитов
- количество твитов, внесённых в favorites
- количество читателей
- суммарное количество читателей всех списков, в которые включён блог
- ратио читатели/друзья
Количество ссылок на микроблог извне, ретвитов, реплаев — на мой взгляд, очень важные и характерные показатели. Также показательно то, как часто твиты попадают в favorites. Подобные параметры с трудом поддаются накрутке.
Во-вторых, пару слов о фильтрации. По поводу поиска и фильтрации по географическому признаку уже говорили, поддерживаю эти мысли. Кроме того, я думаю, что очень трудно однозначно и объективно отнести какой-либо микроблог к одной из категорий, указанных сейчас на сайте. Многие люди посвящающие большинство своих твитов какой-то определённой теме, ещё очень часто твитят и лытдыбры. Наверное, лучше было бы организовать фильтрацию личные микроблоги / микроблоги компаний. А из категорий можно было сделать неплохой каталог микроблогов, но независимый от рейтинга.
Ещё раз спасибо за сервис! Удачи.
Gravatar Алексей Московский 12 января 2010 г. в 20:40 #
pavel_gite, согласен с доводами, у этого параметра на данный момент стоит коэффициент 0.004 если мне не изменяет память. Хотя возможно, стоит уменьшить еще.

Artёm, спасибо за подробный комментарий! Есть над чем подумать. Занес твой коммент в GTD планировщик, буду разбирать:) Моменты спорные есть, но спорные в смысле ресурсоемкости — все таки рейтинг будет довольно большой.
Gravatar CyrilSavitsky 12 января 2010 г. в 21:33 #
2 Pavel_Gite — если в первом случае все действительно однозначно, то во втором — совсем нет. Совершенно не факт, что ценность человека с соотношением 1000/10 выше, чем у человека 1000/500

IMHO соотношение вообще не должно иметь высокого веса — часто оно определяется просто позицией твипла. Просто по себе: я в неделю сам сейчас фолловлю 1-2 человек, остальные приходят. Я легко могу не фолловить их в ответ, но делаю это принципиально — я когда-то об этом писал. ;-)

2 Алексей: Еще одна мысль. Если получится, стоит вычленять твиты, которые идут в виде трансляции с блогов (например, через TwitterFeed) и учитывать их с пониженным коэффициентом.
Gravatar Алексей Московский 12 января 2010 г. в 21:40 #
CyrilSavitsky, извини, пропустил твой коммент. Думаю, что влияние количества твитов на рейтинг — вещь временная. С конверсейшн лист идея здравая, надо будет её рассмотреть поподробнее. А вот анализировать твиты отдельно вряд ли получится — очень ресурсоемкое занятие, хотя и полезное. На всякий случай запишу в планировщик, может быть придется рано или поздно реализовывать.
Gravatar Вася 13 января 2010 г. в 01:35 #
все равно рейтинг яндекса будет рулить, так как сортировка по спискам — бред. Многие делают свои списки приватными, вот и падает количество.
Gravatar Gray 13 января 2010 г. в 02:17 #
Короче, замах был хорош, но удар не получился — рейтинг в итоге возглавили спамфоловеры.
Gravatar Алексей Московский 13 января 2010 г. в 02:19 #
Gray, временное явление. Просто алгоритм не был рассчитан на ТАКОЙ размах массфоловерства. Думаю, завтра все встанет на свои места.
Gravatar CyrilSavitsky 13 января 2010 г. в 03:14 #
Кстати, попробуй посмотреть в качестве одного из показателей отношение номинаций в листы к количеству фолловеров. У этого показателя довольно правильный смысл — доля зафолловивших, посчитавшая человека достойным занесения в списки.
Gravatar Алексей Московский 13 января 2010 г. в 04:26 #
CyrilSavitsky, хорошая мысль, уже вношу изменения в алгоритм.
Gravatar yuriyko 13 января 2010 г. в 05:09 #
Дизайн рейтинга порадовал! Советов выше много — функционал доработаете — будет «конфетка»!
Если возможно, добавить подрубрику фото и предусмотреть /например до 3-х/ возможность указывать несколько рубрик для аккаунта
Gravatar Алексей Московский 13 января 2010 г. в 05:32 #
yuriyko, спасибо! Да, возможно стоит реализовать возможность добавления нескольких категорий для аккаунта.
Gravatar niq 13 января 2010 г. в 10:37 #
Что-то странный рейтинг сегодня. На первых местах люди, у которых мало «друзей», следовательно очень высокий коэффициент фоловеров к друзьям. Имхо несправедливо. Например, @absolvo при «членстве» (самом важном показателе) всего 87 имеет рейтинг всего чуть-чуть уступающий @ekozlov'у, несмотря на то, что у последнего фолловеров в 40(!) раз больше и «членств» в 4 раза — просто из-за того, что частно от деления фолловеров на друзей у него равно пяти. Дурь, короче.
Имхо, нужно фиксить это, причем сильно. Вообще не понимаю зачем это отношение нужно использовать? Из-за того, что я по доброте душевной фолловлю тех, кто зафолловил меня — я должен упасть в рейтинге? А дядя Вася набрал тыщщу фолловеров за пару дней, отфолловился от 90% из них и он — крутой перец?

Хотя может я туплю и причина не в этом. Хотя сомневаюсь — первая двадцатка говорит сама за себя. Если я ошибаюсь, то сорри.
Gravatar CyrilSavitsky 13 января 2010 г. в 11:01 #
Алексей, изменения заметны сразу — в формуле появился сильный перекос в сторону соотношения Followers/Following. Обрати внимание — по обпубликованным показателям разница между @CyrilSavitsky и @DimokRu — исключительно в этом соотношении. Рейтинг отличается в три раза.
Gravatar CyrilSavitsky 13 января 2010 г. в 11:14 #
С соотношением я вчера долго думал — скорее всего, надо использовать дискретную шкалу, отсекающую массфолловеров. То есть, например (надо считать — эти цифры навскидку) — при соотношении Followers/Following меньше 0,5 — вес единый (например, 1). При коэффициенте выше 1,1 — тоже единый (например, 0,3 — от балды). В промежутке — реальная расчетная зависимость (единственное, функцию я бы брал не линейную, а логарифмическую).

Почему 1,1 — при количестве фолловеров больше 2000 — есть ограниченное Твиттером соотношение — 1,2 то есть, те, кто подходят к нему — практически гарантировано массфолловеры.
Gravatar CyrilSavitsky 13 января 2010 г. в 11:19 #
А niq совершенно прав. В рейтинге есть персонажи (например, @Tyomma), которые набрали количество массфолловерскими приемами, после чего от всех отписались, а теперь потихоньку добавляют опять на условиях взаимности.
Gravatar Владислав Судаков 13 января 2010 г. в 11:30 #
Пока у меня не Twitter аккаунта. Но когда он будет этот сервис будет для меня очень полезен.
Gravatar Константин 13 января 2010 г. в 11:40 #
Интересный сервис. Заинтересовался, зарегистрировался.
Первый же нюанс (с конкретным примером): маловато категорий.
Вот, скажем, у меня, в основном, тематика — туризм и путешествия.
И куда мне её отправлять? в Спорт? Как-то не катит. Про общее — вообще молчу.
Равно как и найти кого-нибудь для себя — точно так же. А жаль.

А в целом — спасибо, интересно получилось. Желаю успехов!
Gravatar Андрей 13 января 2010 г. в 12:01 #
Я не согласен, что надо учитывать Favorites. Многие этой функцией не пользуются, чтобы запомнить интересный твит. Я иногда запоминаю для себя человека, чтобы быстро отыскать, а твит выбираю любой. Это не показатель.
Однако считаю, что поскольку Твиттер русскоязычный — то учитывать надо только русскоязычные твиты и только русскоязычных фолловеров. Иностранных рейтингов предостаточно, а нам нужен русскоязычный.
Gravatar CyrilSavitsky 13 января 2010 г. в 12:16 #
2 Андрей — идея с Favorites все-таки, довольно здравая.

Алексей, кстати, Favorites довольно легко учитывать в Вашем рейтинге — надо просто договориться с @Din и \«тянуть\» Favorites-рейтинг с его проекта, учитывая его с каким-то весом.
Gravatar Алексей Московский 13 января 2010 г. в 16:56 #
CyrilSavitsky, во многом ты прав, но я не согласен насчет Тёммы. Возможно мы немного не так расставили приоритеты. Цель рейтинга не выявить и зафильтровать всех массфолловеров. Цель — выявить наиболее полезные аккаунты. Полезен ли аккаунт Тёммы? Несомненно.
В качестве примера еще раз приведу в пример аккаунт Ленара Амирханова (@slaid89). Массфолловер? Еще какой! Но читать его приятно, ведь так?

С другой стороны прав и niq — нельзя повышать рейтинг тех кто зафолловил много народу, а потом от всех отписался.

Кстати, niq, отвечая на твой вопрос — «Из-за того, что я по доброте душевной фолловлю тех, кто зафолловил меня – я должен упасть в рейтинге?». Да должен — по формальным признакам этот аккаунт будет признан массфолловерским. Согласись, что читать такую ленту будет невозможно, а следовательно твой аккаунт будет работать в режиме read-only. Впрочем, опять таки спорный вопрос — ведь на качестве публикуемых тобой материалов это вряд ли отразится.

По поводу Favorities — это очень тяжелый параметр. Тяжелый потому что в фаворитихз добавляют довольно редко и не всегда за качество твита. Иногда фаворитиз играет роль временных закладок.
Все вышенаписанное под большим ИМХО.
Gravatar niq 13 января 2010 г. в 18:54 #
Алексей, в том-то все и дело, что вопрос спорный. Я, например, масс-фолловер. Ничего стыдного здесь не вижу, мне приятно видеть большое число фолловеров, это льстит моему самолюбию :) При этом у меня есть лист избранных мной твиплов, который я и ставлю в отображение, как ленту. То есть читаю я интересных мне людей, а с неинтересными обмениваюсь цифрами в графе «following». При этом я не бот, не спамер, не пишу бессмыслицу и т.п. Таких, как я, много, и почти все они — интересные люди, которые есть в моем листе для чтения. Не нужно масс-фоловинг приравнивать к «нечестному способу и накрутке рейтинга». Примеры Теммы и Ленара тому доказательства.
Gravatar CyrilSavitsky 13 января 2010 г. в 20:17 #
Алексей, совершенно необязательно аккаунт с 1000+ Following является массфолловерским. Все дело в том, что нормальные десктопные программы вполне позволяют выделять постоянные группы. Я про это как-то писал на RuTwittere — заморочка в том, что директ тебе могут написать только те люди, которых ТЫ фолловишь. Я использую свой аккаунт одновременно для поддержки своих проектов, в частности, twitterian.info — далеко не все вопросы можно обсудить в открытой ленте.

В списке для чтелния в TweetDeck у меня около 300 человек — это я тоже никогда не скрывал. При этом, англоязычные аккаунты я взаимно не фолловлю; от акаунтов, «мертвых» более месяца — отписываюсь. Причем здесь массфолловинг?
Gravatar CyrilSavitsky 13 января 2010 г. в 20:23 #
Алексей, с примером о Ленаре — ты сам себе противоречишь. Ленар интересен? Ну и где он с рейтингом 63?

То же самое по поводу Теммы. Я не читаю его в Твиттере (мне это неинтересно), но подписан на RSS блога. Однако, речь не об этом. У тебя в рейтинге громадная дыра (которой неосознано воспользовался Темма), позволяющая манипулировать позицией — как только массфолловер от всех отписывается (не только массфолловер — скажем, если я отпишусь почти от всех, я потеряю максимум сотни две фолловеров) — позиция в рейтинге сразу взлетит.
Gravatar Алексей Московский 13 января 2010 г. в 21:23 #
CyrilSavitsky, в принципе я прихожу к мысли, что наиболее приемлимым в условиях экономии ресурсов было бы рассматривать отношение [listed/followers], попутно учитывая некоторые другие параметры типа followings. Как ты думаешь?

То есть несмотря на возражения в комментариях выше, я по-прежнему считаю что listed _пока что_ довольно объективно свидетельствует о качестве аккаунта. По крайней мере такую корреляцию я вижу «на глаз».

Сегодня еще поэкспериментирую с алгоритмом.
Gravatar Алексей Московский 13 января 2010 г. в 21:24 #
По поводу Ленара — он был на первой-второй странице до тех пор пока я сегодня в полночь не подкрутил алгоритм в сторону фильтрации массфолловеров.
Gravatar CyrilSavitsky 14 января 2010 г. в 00:44 #
В целом, согласен.

Посмотри еще такую идею — для примерного учета количества conversationlist считать среднее количество твитов в день (хотя, я здесь пролетаю, например — я около двух месяцев назад резко сократился). и при показателях, скажем, до 25 в день использовать коэффициент 1, а дальше линейно понижать, например, до 0,75. И при пасчетах использовать не прямое количество списков, а нормированное на понижающий коэффициент — так ты немного «завалишь» многоговорящих, которые попадают не в стационарные списки, а во временные.

А с соотношением Following/Followers я бы сделал просто: до 0,5 — коэффициент 1, 0,5-0,8: к 0,9, 0,8-1: к 0,75, 1-1,1 — к 0,5 1,1-1,2 — к 0,25, более 1,2 — 0 (это массфолловеры 100%). Можно сделать еще специальный повышающий коэффициент для тысячников: колличество фолловеров более 2000 и соотношение меньше 0,15 — 1,25
Gravatar DiVolk 14 января 2010 г. в 05:28 #
Интересный получился рейтинг. Есть замечания:
1) активные (качественные ничего не скажешь) боты с Username, явно на продажу, получили довольно высокие рейтинги (@NewsInternet,@SEO_Russia @TwitReklama — таких больше десятка могу назвать только на вскидку). Т.е количественные показатели не всегда говорят о качестве(далеко не всегда). Как пример: Ни в коем случае не хочу сравнивать авторов этих микроблогов @SEOinSoul и @slaid89, но тви-аккаунты у них явно не равнозначные по популярности
2) Каждому микроблогу, по отдельной теме! И, да будет, он первым!
3) Ты меня извини, но @Umputun, я перенес в «роботы». :-) У тебя, что каждый может хозяйничать?
Выбор рубрики по умолчанию лучше сделать пустым, почти все регистрируются в SEO.
Gravatar DiVolk 14 января 2010 г. в 05:49 #
Кста, вот все, массфолловеры, массфолловеры, а в топ-10 «Рекордсмены роста за сутки» у тебя 3 бота.
Походу, серьезная проблема для твоего рейтинга, им твой рейтинг в самый раз.
Gravatar Алексей Московский 14 января 2010 г. в 13:39 #
DiVolk,
1) Да, алгоритм требует обкатки и доработки. На сегодняшний день, его состояние можно оценить как «удовлетворительное». Причем, что характерно, всех все равно удовлетворить алгоритмом, каким бы он ни был не получиться:) Сейчас тестирую, еще одну его вариацию, которая, думаю, станет последней и далее развиваться будет она;
2) Давай глобальнее — по отдельному рейтингу :D
3) Ты застал период, когда я отрабатывал возможность редактирования категории для аккаунта. Сейчас эта функция заблокирована.

Б-г с ними с ботами и массфолловерами. На мой взгляд, рейтинг должен заниматься не фильтрацией массолловеров и роботов, а выявлением популярных и интересных аккаунтов. Если массфолловер и бот пользуются популярностью — зачем их фильтровать?
Gravatar Алексей Московский 14 января 2010 г. в 13:41 #
Т.е. фильтрация массфолловерство — это не самоцель рейтинга, это всего лишь борьба с одним из проявлений унылости. Работы ведутся как раз в этом направлении.
Gravatar niq 14 января 2010 г. в 14:45 #
Пока рейтингу это не удается, скажем прямо.
Не знаю, почему бы просто не убрать вообще отношение фолловеров к друзьям и учитывать только русских фолловеров? Это решило бы все проблемы.

CyrilSavitsky — Больше, чем 1,1 отношение не получится — Твиттер блокирует.
Gravatar Алексей Московский 14 января 2010 г. в 14:53 #
niq, это очень ресурсоемкое решение — не хватит ни ресурсов сервера, ни ресурсов, которые предоставляет сам Твиттер. Кроме того, при таком подходе @ekozlov опять-таки будет на вершине ТОПа.

В ближайшее время введу алгоритм, который будет учитывать соотношение числа фолловеров к числу listed — ме кажется это будет наиболее адекватное из допустимых решений.
Gravatar niq 14 января 2010 г. в 15:49 #
Почему ресурсоемкое? Можно с твим.ру договориться :)
Соотношение числа фолловеров к листед — это тоже неправильно. Тогда @ekozlov, @pempu, я да и многие другие вообще внизу рейтинга будут. Если вы решили делать анти-массфоловерский рейтинг, то он будет необъективен. А то, что рейтинг очень категорично относится к массфоловерам — это видно невооруженным глазом. Откуда такая ненависть, не пойму? :)
Gravatar Алексей Московский 14 января 2010 г. в 16:05 #
Так, сегодня напишу пост, в котором все проясню, в том числе и отношение к массфолловерам:)

А пока просто взгляните на выборку из категории «SEO и блоггинг», я считаю что она прекрасна:)
Gravatar Андрей 14 января 2010 г. в 21:39 #
CyrilSavitsky Не согласен, что надо учитывать количество Твитов в день и общее количество твитов ни о чем не говорит. Флуд о том кто что сЪел — никому не интересен. Правильный показатель — общее отношение ретвитов к общему отношению твитов за весь период. Это в основном и свидетельствует о ценности твитов для всех. А если Ваня дружит с Маней и чатится в Твиттере — так они только ленту засоряют и все.
Еще можно ввести столбец сколько человек в Твиттере — просто для информации.
И ввести возможность изменить категорию, но скорее, через почту, чтобы другие не могли это сделать.
Gravatar Андрей 14 января 2010 г. в 21:45 #
niq Согласен с тобой — что плохого, если тебя читают многие? Только лучше. Это же не чат. А сейчас в рейтинге — у кого меньше фолловеров — тот выше. НО еще важно — качество фолловеров — а это русскоязычные фолловеры. Кстати, русскоязычных фолловеров много иметь — сложно и даже очень. А вот иностранцы фолловят всех подряд. Без оценки русскоязычных фолловеров — все ваши соотношения с фолловерами — ни о чем. Иностранцы и в листы всех включают без разбору.
Gravatar Андрей 14 января 2010 г. в 21:54 #
DiVolk Почему ты считаешь, что если имя красивое, то это обязательно бот? И кто такой бот по твоему мнению? И о чем надо писать, чтобы ты не считал аккаунт ботом? О том, как ты ешь или ковыряешь в носу? А что такое тематический блог? Микроблог это тот же блог.
Gravatar Андрей 14 января 2010 г. в 21:59 #
CyrilSavitsky Да, я согласен. Часть народу просто хитрит — сначала он первым тебя фолловит, а потом отписывается в надежде, что ты не заметишь или тебе лениво будет его выискивать. Фоловить или не фолловить в ответ — это воля каждого. Мне нравится читать других, кто-то любит только дружить, кто-то считает себя умнее всех. У каждого свои цели.
Gravatar CyrilSavitsky 15 января 2010 г. в 01:03 #
niq — я считал, что предел 1,2. Если ошибался — просто верхние границы не 1,1 и 1,2, а 1,05 и 1,1

Однако, это верно только для аккаунтов 2000+ — меньше соотношение может быть любое.

Андрей — мысли правильные, но сложнореализуемые запросами к API твиттера.

Кстати, если Ваня чатится с Маней, то ленту они засоряют только друг другу и тем, кто фолловит обоих. Больше никому.
Gravatar Андрей 15 января 2010 г. в 12:22 #
CyrilSavitsky — Tweem.ru легко определяет количество русскоязычных фолловеров и таким образом определяет стоимость рекламных услуг микроблога. Жаль, что Блогун это не делает для своих клиентов.
DiVolk — а @NewsInternet, кстати нормальный пацан и зря ты его в боты записал.
Gravatar Сергей М. 16 января 2010 г. в 19:41 #
И непонятную катгорию «для женщин» зохватил Аосиняо. «Музыка и кино» — что это? Творческие люди, может быть?

Действительно не хватает «маркетологов/рекламистов» (их полно в Тви), «корпоративных блогов» (куда без них — можно сразу добавить Яндекс)

Ну и, конечно, «разработку», где я вдруг лидирую, стоит переименовать в что-то более удобное и отражающее связанность с IT. Да и вообще бы этот раздел и дизайн разделить на сферы — «программисты», «юзабилисты» и т.п. Даже если верить нашей статистике http://iskariot.ru/portrait/stats/ с уровнем доверия в 20% (на тот момент), айтишников в Тви слишком много, чтобы их сбрасывать в одну категорию. Маркетологов и рекламистов я бы тоже разделил, чтобы не смешивать странное хобби с работой.
Gravatar Алексей Московский 17 января 2010 г. в 17:06 #
Сергей, Корпоративные блоги — это категория «Сообщества». Согласен, немного расплывчато.

Спасибо за дополнения, все необходимые, на мой взгляд, изменения я внес.
Gravatar Валентин Васин 17 января 2010 г. в 17:54 #
Ну наконец-то, я тупой, ничего не смыслящий в английском языке, а следовательно, и в сервисе Твиттера, мудак, могу увидеть, как наиболее эффективно искать пользователей. Будем работать, будем смотреть. Леша, спасибо!
Gravatar Алексей Московский 17 января 2010 г. в 18:37 #
Ну ты, Валь, загнул! Всем бы так не смыслить:)
Gravatar niq 29 января 2010 г. в 08:54 #
Хм. У меня теперь рейтинг = 0. За что меня так? :)
Gravatar Алексей Московский 29 января 2010 г. в 19:46 #
Опа, спасибо что обратил внимание! Сейчас балансируем алгоритм, и вылезают вот такие огрехи. Кубик Рубика отдыхает:)
Внес коррекцию в алгоритм.
Gravatar niq 30 января 2010 г. в 07:57 #
Нифига себе внес коррекцию!

У этого человека рейтинг в три раза больше моего. Сравни показатели.
Gravatar niq 30 января 2010 г. в 07:58 #
Хм, теги здесь не работают :(
Сравни:
http://twirate.ru/bniq/ — это я с рейтингом 17
http://twirate.ru/DogsRussia/ — это кто-то с рейтингом 43

! Имя:
! Электропочта: