22/08/2013
Уважаемые коллеги, добрый день!
Заметил, что трафик из Яндекса и Google в срезе по дням идет пилообразными кривыми. Те сегодня 100 посетителей, завтра 70, послезавтра 100, потом 70 и тд. При этом среднее кол-во посетителей примерно одинаково, чехарда идет именно по дням.
Кто нибудь сталкивался с этим? И если и объяснить сможете, почему так, будет совсем замечательно.
Заметил, что трафик из Яндекса и Google в срезе по дням идет пилообразными кривыми. Те сегодня 100 посетителей, завтра 70, послезавтра 100, потом 70 и тд. При этом среднее кол-во посетителей примерно одинаково, чехарда идет именно по дням.
Кто нибудь сталкивался с этим? И если и объяснить сможете, почему так, будет совсем замечательно.
22/08/2013
100 и 70 посетителей не просто незначительные колебания, а, фактически, их отсутствие ввиду незначительного количества посетителей чтобы делать по ним какие-либо выводы (если это живые посетители).
22/08/2013
Я согласен, что колебания незначительны, меня больше интересует периодичность. Это явно не статистические отклонения, т.к. присутствует закономерность.
22/08/2013
Если трафик не покупался, то открывайте любую хоть яндекс стастику по вашему сайту и смотрите по каким запросам, в какое время, кто и откуда (география) к вам заходит и ищите закономерности, если они вам видятся. Любые иные методы поиска закономерностей в этом вопросе есть стучание в шаманский бубен.
22/08/2013
Rock:
Я согласен, что колебания незначительны, меня больше интересует периодичность. Это явно не статистические отклонения, т.к. присутствует закономерность.
Я согласен, что колебания незначительны, меня больше интересует периодичность. Это явно не статистические отклонения, т.к. присутствует закономерность.
Вам ведь ответили, что сами абсолютные величины числа посетителей незначительны, а не их колебания.
А так да, по статистически не значимой выборке можно анализировать что угодно - хоть размер колебаний ее значений, хоть их периодичность, даже сезонность можно ))
если отвлечься от цифр, то все равно непонятно что конкретно Вас удивляет. Да, каждый день в Яндекс приходит не одно и то же число пользователей, и они пишут не одно и то же количество не одинаковых запросов.
Пойдите на http://wordstat.yandex.ru/, забейте там какой-нибудь запрос, который ищут сотни тысяч раз в неделю, например "автомобиль", и поудивляйтесь колебаниям - от недели к неделе запросов то то 1,5 млн., то 1,8 млн.
Точно так же можете посмотреть конкретно свои запросы. Есть ли по ним какая-то динамика во времени.
22/08/2013
Николай, количество посещений в этом случае не имеет абсолютно никакого значения. Представтьте что вы кидаете монету, и она постоянно падает поочередно то решкой то орлом. Через множество подбрасываний вы будете видеть ровную картинку по орлам-решкам, но, согласитесь у вас не получится каждый раз чередовать выпадение орла с решкой. Всего одно подбрасывание в день, а выводы сделать можно.
Если вы посмотрите на вордстате статистику по автомобилям, вы не найдете закономерности которую я описал, так что это не очень релевантная информация.
Ну и про статистическую выборку - выборка - это количество измерений определенной величины, что никак не связано с абсолютными значениями. За величину здесь можно например принять рост или падения трафика (растет - 1, падает -0) - получится та же история что с монетой. Колебания же абсолютной величины составляют ни много ни мало 30%.
Собственно по своим запросам - тк трафик небольшой и приходит в основном по низкочастотникам, отдельно по каждому запросу я такой картины не уловил, к сожалению. Для этого и задаю вопрос здесь, возможно кто-то тоже замечал такую историю и разобрался почему она возникает.
Если вы посмотрите на вордстате статистику по автомобилям, вы не найдете закономерности которую я описал, так что это не очень релевантная информация.
Ну и про статистическую выборку - выборка - это количество измерений определенной величины, что никак не связано с абсолютными значениями. За величину здесь можно например принять рост или падения трафика (растет - 1, падает -0) - получится та же история что с монетой. Колебания же абсолютной величины составляют ни много ни мало 30%.
Собственно по своим запросам - тк трафик небольшой и приходит в основном по низкочастотникам, отдельно по каждому запросу я такой картины не уловил, к сожалению. Для этого и задаю вопрос здесь, возможно кто-то тоже замечал такую историю и разобрался почему она возникает.
22/08/2013
В целом, еще раз отмечу, что интересуют не абсолютные колебания +-30 пользователей - это копейки, это понятно. А именно почему возникают последовательности в месяцы (при положительном общем тренде) - когда день за днем чередуются падения и возрастания трафика. Теоретический интересный вопрос, если хотите Возникший при этом из совершенно реальной наблюдаемой ситуации.
22/08/2013
Я не поленился, построил рост +1 и падение -1 относительно предыдущего раб. дня трафика с Яндекса по рабочим дням за последний квартал.
В сумме получил +1 по имеющимся 65 измерениям.
Т.е. трафик то растет, то падает. Причем равновероятно.
А сам трафик (среднее по 5 рабочим дням) загадочным образом при этом вырос аж на 18% за этот же период ))
Посмотрите показы в Директе. Там четко видно, сколько раз были показаны Ваши объявление каждый день, и исходя из этого можно сделать вывод о том, насколько активны были ищущие по Вашей тематике.
Я всегда так делаю - если кажется что в какой-то день с поиска идет мало людей, иду и проверяю в Директе - если и атм показов мало, значит покупатель просто залег на дно. А если там в сравнении с предыдущими днями показов как надо, значит у меня упали позиции в поиске какие-то важные скорее всего.
В сумме получил +1 по имеющимся 65 измерениям.
Т.е. трафик то растет, то падает. Причем равновероятно.
А сам трафик (среднее по 5 рабочим дням) загадочным образом при этом вырос аж на 18% за этот же период ))
Посмотрите показы в Директе. Там четко видно, сколько раз были показаны Ваши объявление каждый день, и исходя из этого можно сделать вывод о том, насколько активны были ищущие по Вашей тематике.
Я всегда так делаю - если кажется что в какой-то день с поиска идет мало людей, иду и проверяю в Директе - если и атм показов мало, значит покупатель просто залег на дно. А если там в сравнении с предыдущими днями показов как надо, значит у меня упали позиции в поиске какие-то важные скорее всего.
22/08/2013
Ну вот да, по неделям то у меня среднее тоже в порядке и с этим все понятно. И я говорил не про общую сумму кол-ва падений и роста, а именно про их непрерывное чередование. Те если вы будете заменять ноликами и единичками все точки, то в итоге получится ровнейшая пила без пробелов и постоянных уровней -). Буду думать, если что то придумаю напишу здесь. -)
И по директу заодно проверю, спасибо.
И по директу заодно проверю, спасибо.
23/08/2013
Rock:
количество посещений в этом случае не имеет абсолютно никакого значения
количество посещений в этом случае не имеет абсолютно никакого значения
заканчивал матфак, посмеялся от души, спасибо!
Rock:
Представтьте что вы кидаете монету, и она постоянно падает поочередно то решкой то орлом. Через множество подбрасываний вы будете видеть ровную картинку по орлам-решкам, но, согласитесь у вас не получится каждый раз чередовать выпадение орла с решкой.
Представтьте что вы кидаете монету, и она постоянно падает поочередно то решкой то орлом. Через множество подбрасываний вы будете видеть ровную картинку по орлам-решкам, но, согласитесь у вас не получится каждый раз чередовать выпадение орла с решкой.
Пример не просто некорректный, а неверный в корне - рекомендую для начала ознакомиться, какие виды распределений существуют в теории вероятностей
Rock:
Всего одно подбрасывание в день, а выводы сделать можно.
Всего одно подбрасывание в день, а выводы сделать можно.
Да-да, британские ученые примерно так и делают
23/08/2013
Алексей К,
спасибо за конструктивный ответ, на матфаке видимо специальная наука была)). Привет матфаку от физтеха)
спасибо за конструктивный ответ, на матфаке видимо специальная наука была)). Привет матфаку от физтеха)
23/08/2013
Если уж хотите морочить себе голову с поиском закономернсти изменений такого количества посещений, — прислушивайтесь к конструктивному методу изысканий — включать статистику и анализировать её. И все встанет ясно. Покаже вы даже не знаете живые пользователи к вам заходят или нет. Рунеты бороздит очень большое количество агрегаторов каталогизаторов, настольных приложений, сборщиков статистики и контента, представляющихся пользователями.
У части из них стоит запуск кроном, допустим, раз в 2 дня с определенным количеством прогонок из под прокси. Вот вам и колебания числа посетителей.
У части из них стоит запуск кроном, допустим, раз в 2 дня с определенным количеством прогонок из под прокси. Вот вам и колебания числа посетителей.
23/08/2013
Дмитрий,
Про кроновых ботов, спасибо, интересная гипотеза, Думаю при таком кол-ва трафика она действительно может вносить существенный вклад.
Вопрос закрыт, отпишусь по результатам исследования).
Про кроновых ботов, спасибо, интересная гипотеза, Думаю при таком кол-ва трафика она действительно может вносить существенный вклад.
Вопрос закрыт, отпишусь по результатам исследования).
24/08/2013
Rock:
спасибо за конструктивный ответ, на матфаке видимо специальная наука была
спасибо за конструктивный ответ, на матфаке видимо специальная наука была
Оу, если честно, то действительно была. Брат заканчивал физтех, а я матфак, поэтому точно могу сказать, что разница есть, каждый силен в своем
Извиняюсь за стеб, если по существу: да, отдельные науки действительно есть, у нас, например, в отличии от физтеха уклон был больше на экономические составляющие. Если Вам действительно интересно, то то, о чем Вы говорите, можно поискать тут:
- модели исследования операций (здесь в меньшей степени, так как в основном линейные зависимости)
- многомерные статистические методы исследований (здесь в большей степени)
- динамическое моделирование
- ну и эконометрика
Итак, в чем же, собственно проблема:
Rock:
количество посещений в этом случае не имеет абсолютно никакого значения
количество посещений в этом случае не имеет абсолютно никакого значения
Количество здесь очень даже имеет занчение, так как при незначительности выборки, сделанные выводы нельзхя называть корректными. При этом под незначительностью выборки можно понимать как сами абсолютные величины, так и время наблюдения, за которое были собраны исходные данные. Другими словами, одно дело, если Вы наблюдаете процесс в течение 3 месяцев, а другое - если в течение 3 лет.
Rock:
За величину здесь можно например принять рост или падения трафика
За величину здесь можно например принять рост или падения трафика
А вот так делать нельзя.
Постараюсь объяснить почему...
Rock:
при положительном общем тренде
при положительном общем тренде
вы поставили в скобки ключевой момент - тренд. То есть общую тенденцию. Но интересуют Вас отклонения. То есть обычная цикличность процесса (сезонность). Кстати говоря, о том, что это обычная цикличность, обычный "шум" в тренде говорит это:
CheMuerto:
построил рост +1 и падение -1 относительно предыдущего раб. дня трафика с Яндекса по рабочим дням за последний квартал.
В сумме получил +1 по имеющимся 65 измерениям.
построил рост +1 и падение -1 относительно предыдущего раб. дня трафика с Яндекса по рабочим дням за последний квартал.
В сумме получил +1 по имеющимся 65 измерениям.
Хотя и выборка тоже незначительная.
А тепреь о том, что неправильного делаете далее:
Вы хотите исследовать процесс сезонности, но отказываетесь от его абсолютных значений, то есть, отказываясь от абсолютных значений, замещая их фактом колебаний вверх или вниз (0 и 1), Вы "вычищаете" тренд от сезонности, пытаетесь опустить ее в исследовании. Так делают, когда исследуют тренд, желая избавиться от всех несущественных факторов влияния на итоговые показатели в зависимости.
Но тут же оказывается, что исследуюте Вы все таки сезонность, но показатели ее уже свели к несущественным
Может коряво объясняю, извините...
Еще такой простейший пример, почему так делать нельзя: то, что Вы видете сезонность, Вы знаете. Исследуя ее в абсолютных величинах Вы видите, что в одном месте было положительное отклонение на 1000 единиц, а в другом - на 1. По факту у Вас и то, и другео будет фактом роста - будет идиницей или нулем. Сводя все к единицам и нолям, Вы можете говорить только об одном - я вижу (я не вижу) сезонность.
Далее по колебаниям: исследовать нужно в абсолютных величинах, так как без этого утверждать об коррелируемости факторов и их тесноте связи нельзя. Высока вероятно получения так называемой ложной регрессии. Самое простейшее, что вообще можно сделать - посчитать СКО и посмотреть, как часто оно отклоняется за пределы нормального диапазона отклонений в Вашей выборке. Но опять же - выводы можно делать при достаточном временном наблюдении.
Ответить