III. Экспериментальные результаты.
Каковы же экспериментальные результаты?
Были собраны и обработаны результаты 624 тиражей "Спортлото 5 из 36" с 1-го тиража 1982 года по 52-й тираж 1993 года [12]. Этот ряд почти полностью перекрывает временной диапазон, в течение которого данные отвечали качествам однородности и репрезентативности, т.к. данная модификация игры началась с 1-го тиража 1981 г., а в 1993 г., данные начали терять свою представительность (например, одно отделение Украины уменьшило число вариантов, участвующих в каждом тираже, примерно на 20-25%). Вообще же число вариантов, участвующих в одном тираже, уменьшилось с 11 миллионов (в среднем) в 1983 - 1991 гг., до нескольких сотен тысяч вариантов к 1995 г. Это, видимо, явилось следствием начала свободного предпринимательства, взрывного увеличения числа лотерей и разных авантюр (например "пирамида" МММ и т.д.), а также существенного уменьшения числа игроков в результате разрушения СССР и пр.
Дополнительно были собраны и частично обработаны результаты 364 тиражей "Спортлото 6 из 45" с 1-го тиража 1986 года (с первого тиража этой игры) по 52-й тираж 1992 года. Частичность обработки объясняется на порядок меньшим объемом, при сравнимых, и даже меньших вероятностях удач. То, что мы имеем материал по двум независимым, но аналогичным и синхронно происходящим случайным событиям, позволило, по возможности, сопоставлять результаты.
Обработка данных производилась с помощью программы Excel/97 на 32-битовом персональном компьютере, т.е. точность вычислений была более чем удовлетворительной.
Массив экспериментальных данных характеризуется следующими значениями ( табл. 2):
, где V - число присланных ("играющих") вариантов, m - индекс, означающий, что m цифр "играющего" варианта совпали с цифрами, выпавшими в соответствующем тираже (сообщались данные только для m = 3, 4 и 5), Sum, min, max, AVERAGE - сумма, минимальное, максимальное и среднее значения по соответствующим рядам.
Невозможно не акцентировать внимание на суммарном числе испытаний (т.е. на числе попыток предсказать) - 6.9 МИЛЛИАРДОВ! Как отмечалось выше - аналогий нет и не ожидается.
Т.к. изменение числа участвующих от тиража к тиражу вариантов различается на порядок (см. таблицу 2), то мы не можем непосредственно вычислять статистические характеристики, например среднее, используя абсолютные значения числа выигрышей n(m), и должны перейти к вероятностям выигрыша pEx(m) = n(m) / V , где pEx(m), n(m), V - относятся к одному и тому же тиражу. Очевидно, что этот переход не меняет самого распределения B(N,K,p), т.к. p не меняется. В результате замены n(m) на pEx(m), экспериментальные точки несколько иначе расположатся на кривой распределения, однако среднее (max распределения) не смещается (изменяется только дисперсия выборки). Учитывая, что существует такой метод проверки гипотез, как X**2 - критерий Пирсона, требующий группировки данных в достаточно произвольных интервалах, мы получаем дополнительное подтверждение правомерности указанного перехода.
В таблице 3 представлены исходные данные в форме вероятностей и основные результаты их статистической обработки.
Как известно, существуют различные методы оценок теоретических величин по экспериментальным. В связи с важностью вопроса, мы провели оценку среднего тремя способами: методом моментов, максимального правдоподобия и с учетом неравноточности наблюдений.
Оценка "pEx(m) среднее" таблицы 3, основана на методе моментов. Она, являясь общепринятой и интуитивно понятной, вычисляется как ( [11], стр. 200):
AVERAGE[pEx] = {Sum[pEx(i)]} / NTir,
D = {Sum[pEx(i) - AVERAGE(pEx)]}2 /{NTir - 1},
s(выборки) = SQRT( D ),
s(среднего) = s(выборки) / SQRT(NTir),
, где AVERAGE[pEx] - среднее, D - дисперсия выборки, s(выборки) - отклонение точек выборки от среднего, s(среднего) - отклонение для среднего значения pEx. Суммирование производится по всем тиражам.
Далее, для величины нормированных отклонений, мы будем использовать термин: "в сигмах" при нормировке на s(выборки), и не будем использовать его при нормировке на s(среднего).
В строке "pEx (макс. правдоподобия)" представлена оценка, полученная методом максимального правдоподобия. Эта оценка вычисляется следующим образом [10, стр. 231]:
pEx(m) (макс. правдоподобия) = {Sum[n(m,i)]} / {Sum[ V(i)]}
, где суммы берутся по всем тиражам, n(m,i) - абсолютное число вариантов в которых угадано ровно m чисел в i-м тираже, V(i) - объем i-го тиража.
В строке "pEx (неравноточные набл.)" представлена оценка, полученная с учетом неравноточности наблюдений (правила вычисления этой оценки см [11], стр. 191). После элементарных преобразований, учитывая, что для i- го тиража дисперсия D(i) = p(m) * q(m) * V(i) , получаем (для нашего случая) оценку абсолютного числа удач (в одном тираже):
AVERAGE[ n(m) ] = {Sum[n(m,i) / V(i)]} / {Sum[ 1 / V(i)]}
, где суммирование производится по всем тиражам. Далее имеем:
pEx(m) (неравноточные набл.) = AVERAGE[ n(m) ] / AVERAGE[V] , где AVERAGE[V] - средний объем одного тиража.
Небольшие расхождения в значениях pEx, полученных разными методами, объясняется, вероятно, тем, что второй и третий из этих методов могут давать смещенную оценку среднего для биномиального распределения ([10], стр.230, [11], стр.203). Однако обратим внимание, что ВСЕ оценки больше теоретического значения и различаются, в общем, незначительно.
По причине доказанной несмещенности, широкого распространения и определенной "эталонности", далее мы везде использовали оценки, полученные методом моментов. Численное значение "pEx(m) среднее", промежуточное относительно других оценок, также говорит о правильности такого выбора.
Сравнивая pEx и pTeor, отметим, что pEx больше pTeor, причем это систематическое, а не случайное превышение. На рис. 1 хорошо виден ход во времени нормированного отклонения pEx от pTeor, когда после обычных колебаний в первых сериях, отклонение уверенно уходит в положительную область и, далее, систематически увеличивается. Нормированное отклонение вычислялось как:
u(m) = {AVERAGE[pEx(t)] - pTeor} / {s(t) / SQRT(NTir(t))}
, где AVERAGE[pEx(t)] - среднее значение вероятности, и s(t) - отклонение выборки для определенного m, а NTir(t) - число тиражей. Эти переменные представляют из себя значения, вычисленные за определенный период t. Например, переменная NTir(t) означает число тиражей от первого до тиража номер i, произошедшего в момент t.
В таблице 4 представлены величины, характеризующие окончательные отклонения на дату последнего тиража (Ф(u) - значение функции распределения нормального распределения в точке u).
В данном случае мы решали задачу, обратную задаче определения доверительного интервала, а именно: по наблюдаемому нормированному отклонению мы вычисляли "уровень доверия" для правостороннего критерия. Таким образом значение функции Ф(u) (в %) играет роль статистической характеристики "надежность доверительного интервала" (или "уровень доверия") и, как легко видеть, ее величина находится в пределах 96.3 - 99.7% для случаев разных m. Мы производим вычисления для одностороннего интервала по причинам, которые легко понять, взглянув на рис. 1, где отчетливо видно систематически положительное отклонение данных (а не случайное попадание в эту область), а также в силу исходного предположения о существование предвидения, т.е. постулируемого превышения экспериментальной вероятности удач над теоретической. Для справки приводятся величины уровня доверия для двухстороннего критерия. Видно, что доказательность ухудшается непринципиально.
Мы просим обратить внимание на результаты таблицы 4 и графики на рис. 1, т.к. это собственно и есть то, ради чего проводилась данная работа и именно то, что должен объяснить со своей точки зрения скептик, не разделяющий нашу точку зрения.
Действительно, отчетливо наблюдаемая на рис. 1 тенденция к росту величин u(m) и их последние значения, которые соответствуют высокой доверительной вероятности, если и нельзя назвать абсолютно доказательными аргументами, то очень значимыми - наверняка.
Таким образом, с вероятностью 96% - 99%, эксперимент подтверждает, с нашей точки зрения, возможность получения информации из Будущего (аргументацию см. далее).
На рис. 2 в относительных единицах (сигмах) приведены кривые экспериментального распределения плотности pEx для m=5, 4 и 3. Бросаются в глаза два факта: первый - сильное (до 0.5 сигм) смещение максимума распределения к началу координат (что может быть объяснено различными стратегиями игры (см. раздел IV). Второй факт - это чрезвычайно тяжелый "хвост" распределения и достаточно явные вторичные максимумы в области положительных отклонений, что является указанием на высокую достоверность гипотезы предвидения. Действительно, т.к. max распределения смещен влево, а pEx больше pTeor, то это означает, что недобирая выигрышные варианты в результате (видимо) предпочтений определенных цифр и их комбинаций, "сообщество" игроков с избытком "компенсирует" это аномально большим числом удачных предсказаний
Для точного сопоставления эксперимента и теории, с помощью специально написанной программы (в 32-битовом варианте Delphy 3), были непосредственно вычислены биномиальные распределения В(N,K,p) для m=5 и m=4 (для m=3 это оказалось технически невозможно). Использовались следующие параметры (с учетом конкретного m): в качестве p брались pTeor в одном случае и AVERAGE(pEx) в другом; N = 1.0E+07 (примерное среднее значение по всем данным); числа K выбирались такими, чтобы по возможности симметрично накрыть значение pEx. Для m=4 параметр K оказался ограничен "сверху" компьютерной потерей точности.
Полученные результаты были сгруппированы в соответствующих интервалах для оценки (по X**2 -критерию Пирсона) степени совпадения рассчитанного биномиального и экспериментального распределений. Для m = 5; величина критерия оказалась равна: X**2 = 2.7Е+35. Для m=4 вычисление X**2 -критерия во всем диапазоне оказалось технически невозможным, но вполне удовлетворительное приближение показало, что значение x превышает 1.0Е+300.
Результаты сравнения экспериментального и теоретического распределений показаны на рис. 3. Приводятся графики, относящиеся только к случаю m=5, т.к. для случая m=4 практически все насчитанные значения B(N,K,p) попадают в интервал одной группы экспериментального разбиения, т.е. мы получаем "дельта" пик (но не в интервале, где находится экспериментальный максимум! ).
На рис. 3 для m=5 показаны следующие кривые:
- pEx - нормированная кривая экспериментального распределения вероятности удач. Все данные разбиты на 25 групп.
- pTeor(=, групп) - результат группировки результатов прямого счета B(N,K,p) (400 точек), для p = pTeor, в те же группы, что и для pEx.
- pEx (=, групп) и pGraph(=, групп) - кривые, полученные аналогично pTeor(=, групп), но после группировки результатов прямого счета B(N,K,p), с использованием (в качестве p) значения AVERAGE(pEx) и значения pGraph, отвечающего максимуму (пику) экспериментального распределения.
Очевидно, что ни один из вариантов расчета не соответствует экспериментальной ситуации, когда хвост оказывается настолько тяжелым, что амплитуда главного пика падает в 2 - 3 раза. Т.о., мы наблюдаем аномальное число удач.
Рисунок 4 демонстрирует корреляцию между вероятностями правильно угадать 5 цифр и 3 цифры в каждом тираже (каждая точка - один тираж). В соответствие с теорией мы должны были бы получить эллипсообразную область (хорошо выраженную и теперь). "Центр эллипса" должно находиться в начале координат, размеченных в единицах нормированного отклонения. Очевидно, что по любой из осей эллипса разброс реальных значений должен, в общем, распределяться по Гауссу, в связи с чем мы и ожидали нечто "эллипсообразное".
В реальности мы видим "суперпозицию" эллипса и неожиданной, веерообразной области. Это вновь означает, что имеется аномально большое число точек с повышенной вероятностью удач. Зависимость pEx(4) от pEx(3) и зависимость pEx(5) от pEx(4) имеют аналогичный характер и не приводятся в целях экономии места.
Итак, теоретические ожидания соответствуют реальным результатам, но "качественно" и содержат очевидные искажения. Поэтому возникает вопрос о том, насколько верно утверждение об ожидаемом биномиальном распределение результатов игры. Мы, по следующим причинам, считаем, что эти ожидания верны:
1. Агенство Спортлото официально использовало и использует именно биномиальное распределение для описания результатов игры. На этой основе происходит расчет денежных потоков, определение размера выигрышей и прочие бухгалтерские действия, в которых учитываются (в буквальном смысле слова! ) копейки.
2. В разделе IV, посвященном рассмотрению причин, могущих исказить теоретическое распределение, выяснилось, что несмотря на то, что ни одна из причин не может полностью объяснить ситуацию, они (причины) действуют и вносят определенные искажения в форму кривой экспериментального распределения.
3. Гипотеза предвидения снимает указанную проблему в силу очевидных искажений, вносимых в теоретическое распределение предвидением. Как следует из рис. 2 и 3, основная аномалия - это уже неоднократно подчеркнутая "тяжесть хвоста" распределения, что, собственно, и должно быть при существовании предвидения. Вопрос о "тонкой структуре" распределения и пр., могут являться темой дальнейших исследований.
4. Отказ от использования биномиального распределения приводит к непредсказуемым последствиям, причем не в теории вероятностей, а на уровне более глубоком - в обычной логике. Действительно, нет абсолютно никаких причин отвергать очевидное: данная игра - это испытание Бернулли и результаты испытаний не то что обязаны, а просто: подчиняются биномиальному распределению.
Таким образом основной и самый общий результат опыта, непосредственно заключавшегося в попытках предсказать результаты испытаний Бернулли, состоит в следующем: 6.9 миллиардов попыток, сделанные за 12 лет, показали, что экспериментальная вероятность удач систематически превосходит теоретическую с доверительной вероятностью, достигшей 96-99% и имеет явную тенденцию к дальнейшему росту.
Гипотеза выдвигаемая для объяснения этого результата заключается в том, что повышенное число удач является следствием присущей человеку способности получать информацию из Будущего.