если результат противоречит гипотезе значит вы сделали открытие
Если результат противоречит гипотезе значит вы сделали открытие
В данном примере мы получаем один позитрон и один нейтрино. Тот факт, что для формирования плавящихся материалов необходимы реакции слабого взаимодействия, гарантирует, что водород Солнца расходуется медленнее, регулируя солнечную активность и увеличивая продолжительность жизни звезды. Ферми не упускал из виду связь своего открытия с космической радиацией. В 1933 году он воспользовался тем, что в Риме находился Бруно Росси, прославившийся разработкой цикла для измерения совпадений в спаренных счетчиках Гейгера и выявления таким образом траекторий частиц, и написал с ним совместную работу «Действие магнитного поля Земли на проникающее излучение». В этой статье объяснялось геомагнитное воздействие широты и долготы на космическую радиацию, достигающую Земли. Ферми был очень доволен результатами в области изучения слабого взаимодействия и считал их своими главными достижениями, достойными того, чтобы остаться в памяти потомков. На основе этой работы японский физик Хидэки Юкава (1907-1981) в 1935 году сформулировал свою теорию мезонов, и с нее началась революция в ядерной физике и физике элементарных частиц.
В январе 1934 года, бомбардируя альфа-частицами ядра бора и алюминия, Ирен Кюри и Фредерик Жолио получили первые искусственные радиоактивные изотопы. Ирен шла по стопам своих родителей, Пьера и Марии Кюри, которые детально изучили поведение естественных радиоактивных изотопов радия и полония и более тяжелых элементов, таких как уран и торий.
Легкие ядра, подвергавшиеся бомбардировке альфа-частицами, довольно быстро излучали позитроны, демонстрируя, таким образом, хорошие радиоактивные свойства, в то время как ядра более тяжелых атомов подобной наведенной радиации не проявляли. Альфа-частицы, как и положительные ионы гелия, не действовали на тяжелые ядра из-за повышенного содержания в них электронов, которые уменьшали воздействие на ядра вследствие электромагнитного отталкивания. Процесс усложнялся и за счет повышенного отталкивания тяжелых ядер.
В начале марта 1934 года в руки Ферми попала статья Кюри и Жолио. Он сразу предложил Разетти провести те же эксперименты, но не с альфа-частицами, а с нейтронами, чтобы избежать электромагнитных трудностей. Разетти разработал несколько источников нейтронов, полония и бериллия, а также еще один, более мощный, радона и бериллия. Он собирался ехать в отпуск, но Ферми не мог тянуть с началом опытов. В отсутствие Разетти ему пришлось самому сконструировать счетчик Гейгера (с чем он блестяще справился) и быстро получить радон для нейтронного источника. Надо сказать, что Ферми повезло: у профессора Джулио Чезаре Трабакки, директора хорошо оснащенных лабораторий итальянской санитарной службы, был радий и необходимые приборы для извлечения из него радона по методу Марии Кюри. Радон — это газ, образующийся при естественном альфа-распаде радия, как доказала Мария Кюри. Если смешать его с пылью бериллия, то порожденные альфа-частицы провоцируют выброс нейтронов.
Если результат подтверждает гипотезу, значит, вы сделали измерение. Если результат противоречит гипотезе, вы сделали открытие.
Энрико Ферми
Ферми начал систематическую бомбардировку в порядке периодической таблицы, взяв водород, литий, бор, углерод и азот. Результаты были отрицательными. Ученый немного упал духом: полученные данные заставили его сомневаться.
Тогда он решил попробовать новые элементы. Ферми пропустил кислород, потому что его бомбардировку надо было проводить в воде, и, бомбардируя фтор, сумел активировать элемент. Отреагировал счетчик Гейгера и на алюминий. Ферми отправил 25 марта 1934 года в журнал La ticerca sdentifica статью «Радиоактивность, наведенная нейтронной бомбардировкой. I», чтобы ее как можно скорее опубликовали.
В статье ученый давал интерпретацию полученных результатов для каждого элемента. Римская цифра I означала, что за этой статьей должны были последовать и другие из этой же серии, что и произошло.
Дата публикации Sep 10, 2019
Область Data Science развивается как никогда раньше. Многие компании в настоящее время ищут профессионалов, которые могут просеять свои данные о добыче золота и помочь им эффективно принимать быстрые бизнес-решения. Это также дает возможность многим работающим профессионалам переключить свою карьеру на область Data Science.
Имея этот ИИ, Data Science окружает многих студентов колледжей и хочет продолжить свою карьеру в области Data Science. И эта шумиха вокруг Data Science правильно провозглашена Томасом Х. Давенпортом и Д.Дж. Патил в одной из статей Harvard Business Review,
«Data Scientist: самая сексуальная работа XXI века»
В современном мире аналитики модели машинного обучения в строительстве стали сравнительно простыми (благодаря более надежным и гибким инструментам и алгоритмам), но фундаментальные концепции по-прежнему сбивают с толку. Одним из таких понятий является проверка гипотез.
В этом посте я пытаюсь прояснить основные понятия проверки гипотез с помощью иллюстраций.
Что такое проверка гипотез? Чего мы пытаемся достичь? Зачем нам нужно проверять гипотезы? Мы должны знать ответы на все эти вопросы, прежде чем мы продолжим.
Статистика это все о данных. Данные сами по себе не интересны. Это интерпретация данных, которые нас интересуют. ИспользованиеПроверка гипотезымы пытаемся интерпретировать или делать выводы о населении, используя выборочные данные.Проверка гипотезоценивает два взаимоисключающих утверждения о совокупности, чтобы определить, какое утверждение лучше всего подтверждается данными выборки. Всякий раз, когда мы хотим заявить о распределении данных или о том, отличается ли один набор результатов от другого набора результатов в прикладном машинном обучении, мы должны полагаться на статистические проверки гипотез.
Давайте посмотрим на терминологию, которую мы должны знать вПроверка гипотезы
1. Параметр и статистика:
параметрявляется кратким описанием фиксированной характеристики или показателя целевой группы населения. Параметр обозначает истинное значение, которое будет получено при проведении переписи, а не выборки.
Пример:Среднее (μ), дисперсия (σ²), стандартное отклонение (σ), пропорция (π)
В реальном мире сложно получить полную информацию о населении. Следовательно, мы выбираем выборку из этой совокупности и получаем те же статистические показатели, упомянутые выше. И эти меры называются выборочной статистикой. Другими словами,
статистикаявляется кратким описанием характеристики или меры выборки. Выборочная статистика используется в качестве оценки параметра совокупности.
Пример:Среднее значение выборки (x̄), дисперсия выборки (S²), стандартное отклонение выборки (S), пропорция выборки (п)
2. Распределение выборки:
Пример:Предположим, что простая выборка из пяти больниц должна быть взята из населения 20 больниц. Возможны следующие варианты: (20, 19, 18, 17, 16) или (1,2,4,7,8) или любая из 15 504 (с использованием комбинаций 20C)) различных образцов размера 5.
В целом среднее значение распределения выборки будет приблизительно эквивалентно среднему значению для населения, т.е. E (x̄) = μ
Чтобы узнать больше о распределении выборки, пожалуйста, проверьте это ниже видео:
Видео из ханской академии
3. Стандартная ошибка (SE):
Стандартная ошибка (SE) очень похожа на стандартное отклонение. Оба являются мерами распространения. Чем выше число, тем больше разбросаны ваши данные. Проще говоря, два термина по сути равны, но есть одно важное отличие. Пока стандартная ошибка используетстатистика(пример данных) использование стандартного отклоненияпараметры(данные о населении)
Стандартная ошибка говорит вам, насколько далеко ваша выборочная статистика (например, среднее значение выборки) отклоняется от фактического среднего значения населения. Чем больше размер вашей выборки, тем меньше SE. Другими словами, чем больше размер выборки, тем ближе среднее значение выборки к среднему значению популяции.
Чтобы узнать больше о стандартной ошибке (SE), пожалуйста, смотрите видео ниже
Теперь давайте рассмотрим следующий пример, чтобы лучше понять остальные концепции.
4. (а) Нулевая гипотеза (H₀):
Заявление, в котором не ожидается никакой разницы или эффекта. Если нулевая гипотеза не отклонена, никакие изменения не будут внесены.
Слово «ноль» в данном контексте означает, что общепринятый факт, что исследователи аннулируют. Это не означает, что само утверждение является нулевым! (Возможно, этот термин следует называть «недействительной гипотезой», поскольку это может вызвать меньше путаницы)
4. (б). Альтернативная гипотеза (H₁):
Утверждение, что ожидается некоторое различие или эффект. Принятие альтернативной гипотезы приведет к изменению мнений или действий. Это противоположность нулевой гипотезы.
Чтобы узнать больше о нулевых и альтернативных гипотезах, пожалуйста, посмотрите это видео ниже
5. (а). Односторонний тест:
Односторонний тест также известен как направленная гипотеза или направленный тест.
5. (б). Двусторонний тест:
По соглашению, двусторонние тесты используются для определения значимости на уровне 5%, то есть каждая сторона распределения сокращается на 2,5%.
6. Тестовая статистика:
тестовая статистикаизмеряет, насколько близко образец пришел к нулевой гипотезе. Его наблюдаемое значение изменяется случайным образом от одной случайной выборки к другой выборке. Тестовая статистика содержит информацию о данных, которые имеют значение для принятия решения о том, следует ли отклонить нулевую гипотезу или нет.
Различные тесты гипотез используют разные статистические тесты, основанные на вероятностной модели, принятой в нулевой гипотезе. Общие тесты и их тестовая статистика включают в себя:
В общем, выборочные данные должны предоставить достаточные доказательства, чтобы отвергнуть нулевую гипотезу и сделать вывод, что эффект существует в популяции. В идеале, проверка гипотезы не позволяет отклонить нулевую гипотезу, когда эффект отсутствует в популяции, и отвергает нулевую гипотезу, когда эффект существует.
К настоящему времени мы понимаем, что вся проверка гипотез работает на основе имеющегося образца. Мы можем прийти к другому выводу, если образец будет изменен. Есть два типа ошибок, которые относятся к неверным выводам о нулевой гипотезе.
7. (а). Ошибка типа I:
Тип-I Ошибка возникает, когда результаты выборки приводят к отклонению нулевой гипотезы, когда она на самом деле верна.Тип-Iошибки эквивалентны ложным срабатываниям.
Тип-Iошибки можно контролировать. Значение альфа, которое связано суровень значимостичто мы выбрали, имеет прямое отношение кТип-Iошибки.
7. (б). Ошибка типа II:
Тип-IIошибка возникает, когда на основании результатов выборки нулевая гипотеза не отклоняется, если она фактически ложна.Тип-IIошибки эквивалентны ложным негативам.
Уровень значимости (α):
Вероятность сделатьТип-Iошибка, и это обозначаетсяальфа (α), Альфа это максимальная вероятность того, что у нас естьТип-Iошибка. Для уровня достоверности 95% значение альфа составляет 0,05. Это означает, что существует 5% вероятность того, что мы отвергнем истинную нулевую гипотезу.
P-значение:
р-значениеиспользуется во всей статистике, от t-тестов до простого регрессионного анализа до моделей на основе дерева, почти во всех моделях машинного обучения. Мы все используемP-значениеопределить статистическую значимость в тесте гипотезы. Несмотря на то чтоР-значениескользкая концепция, которую люди часто неправильно интерпретируют.
P-значениеоцените, насколько хорошо выборочные данные подтверждают аргумент защитника дьявола о том, что нулевая гипотеза верна. Он измеряет, насколько совместимы ваши данные с нулевой гипотезой. Насколько вероятен эффект, наблюдаемый в ваших данных выборки, если нулевая гипотеза верна?
Другими словами, если нулевая гипотеза верна,Р-значениевероятность получения результата как экстремального или более экстремального, чем результат выборки, только по случайной случайности
Высокие значения P:Ваши данные, скорее всего, с истинным нулем
Низкие значения P:Ваши данные вряд ли с истинным нулем
Пример: Предположим, что вы проверяете следующую гипотезу на уровне значимости (α) 5%, и вы получаете значение p как 3%, и ваша выборочная статистикаИксзнак равно25
Интерпретация р-значения выглядит следующим образом:
Мы видели выше, чтоαтакже известен как совершениеТип-Iошибка. Когда мы говорим, αзнак равно5%, мы можем отклонить нашу нулевую гипотезу 5 из 100 раз, даже если это правда. Теперь, когда нашиР-значение3%, что меньшеα(мы определенно ниже порога совершенияТип-Iошибка),означает получение выборочной статистики как можно более экстремальной (x̄>знак равно25) учитывая, что H₀ истинно, очень меньше. Другими словами, мы не можем получить нашу выборочную статистику, если предположим, что H₀ истинно. Следовательно, мы отвергаем H₀ и принимаем H₁. Предположим, вы получаетеР-значениекак 6%, т. е. вероятность получения выборочной статистики как можно более экстремальной, тем выше, учитывая, что нулевая гипотеза верна. Таким образом, мы не можем отказаться от H₀, по сравнению сαмы не можем рисковатьТип-Iошибка больше, чем согласованный уровень значимости. Следовательно, мы не можем отвергнуть нулевую гипотезу и отвергнуть альтернативную гипотезу.
Теперь, когда мы поняли основную терминологию вПроверка гипотезы,Теперь давайте рассмотрим этапы проверки гипотез и приведем пример с примером.
Например, крупный универмаг рассматривает возможность введения услуги интернет-магазина. Новая услуга будет введена, если более 40 процентов интернет-пользователей совершают покупки через Интернет.
Шаг 1: сформулируйте гипотезы:
Подходящий способ сформулировать гипотезы:
Если нулевая гипотеза H₀ отклонена, то будет принята альтернативная гипотеза H₁ и введена новая услуга интернет-покупок. С другой стороны, если мы не сможем отклонить H₀, то новая услуга не должна быть введена, пока не будут получены дополнительные доказательства. Этот тест нулевой гипотезы являетсяодин хвостТест, потому что альтернативная гипотеза выражается направленно: доля интернет-пользователей, которые используют Интернет для покупок, превышает 0,40.
Шаг 2: Выберите подходящий тест:
Чтобы проверить нулевую гипотезу, необходимо выбрать соответствующий статистический метод. Для этого примераZ статистика, которая соответствует стандартному нормальному распределению, будет уместной.
z = (p-π) / σₚ, где σₚ = sqrt (π (1-π) / n)
Шаг 3: Выберите уровень значимости, α:
Мы поняли чтоУровень значимостиотносится кТип-Iошибка. В нашем примере ошибка Типа I произошла бы, если бы мы пришли к выводу, основываясь на выборочных данных, что доля клиентов, предпочитающих новый тарифный план, была больше 0,40, тогда как на самом деле она была меньше или равна 0,40.
Ошибка типа II возникла бы, если бы мы пришли к выводу, основываясь на выборочных данных, что доля клиентов, предпочитающих новый тарифный план, была меньше или равна 0,40, тогда как фактически она была больше 0,40.
Необходимо сбалансировать два типа ошибок. В качестве компромисса α часто устанавливается на 0,05; иногда это 0,01; другие значения α редки. Мы рассмотрим 0,05 для нашего примера.
Шаг 4: Соберите данные и рассчитайте статистику теста:
Размер выборки определяется после учета требуемого значения α и других качественных соображений, таких как бюджетные ограничения для сбора данных выборки. Для нашего примера, скажем, 30 пользователей были опрошены, а 17 указали, что они использовали Интернет для покупок.
Таким образом, значение пропорции выборки составляетр = 17/30 = 0,567.
Значениеσₚ = SQRT ((0,40) (0,60) / 30) = 0,089.
Тестовая статистикаZможно рассчитать как
г = (р-π) / σₚ = (0.567-0.40) /0.089=1.88
Шаг 5: Определите вероятность (или критическое значение):
Используя стандартные нормальные таблицы из приведенного выше, вероятность полученияZзначение 1,88 составляет 0,96995, т.е.Р (z≤1.88) = 0,96995,Но мы хотели вычислить вероятность справа отz (потому что мы заинтересованы в получении значения вероятности, которое попадает в область отклонения или критическую область),то есть1-0.96995знак равно0,03005, Эта вероятность прямо сопоставима с(поскольку α совершает ошибку Типа I, а рассчитанное нами значение вероятности также попадает в критическую область)
Если вы хотите понять, как искать значения вероятностей для данных z-оценок, посмотрите видео ниже:
В качестве альтернативы, критическое значениег,который даст область справа от критического значения 0,05, находится между 1,64(при 1,64 вероятность составляет 0,94950)и 1,65(при 1,65 вероятность равна 0 95053)и равен 1,645(вероятность равна 0,95, то есть слева от нормального распределения, что означает, что справа она равна 0,05),
Если вы хотите понять, как искать критическое значениеα,Пожалуйста, посмотрите видео ниже:
Шаг 6 и 7: сравните вероятность (или критическое значение) и примите решение:
Вероятность, связанная с вычисленным или наблюдаемым значением статистики теста, составляет 0,03005. Это вероятность полученияР-значение0,567 (доля образца =п)когда π = 0,40. Это меньше уровня значимости 0,05. Следовательно, нулевая гипотеза отвергается.
В качестве альтернативы рассчитывается значение тестовой статистикиг = 1,88лежит в области отклонения, за пределами значения 1,645. Снова, тот же самый вывод отклонить нулевую гипотезу сделан.
Обратите внимание, что два способа проверки нулевой гипотезы эквивалентны, но математически противоположны в направлении сравнения. Если вероятность, связанная с вычисленным или наблюдаемым значением тестовой статистики (TSCAL), равнаменьше, чемНа уровне значимости (α) нулевая гипотеза отвергается. Однако, если абсолютное значение рассчитанного значения статистики тестабольше чемабсолютное значение критического значения тестовой статистики (TSCR), нулевая гипотеза отклоняется. Причина этого смещения знака состоит в том, что чем больше абсолютное значение TSCAL, тем меньше вероятность получения более экстремального значения тестовой статистики при нулевой гипотезе.
если вероятность TSCAL | TSCR |, затем отклонить H₀
Шаг 8: Вывод:
В нашем примере мы заключаем, что есть свидетельства того, что доля интернет-пользователей, совершающих покупки через Интернет, значительно превышает 0,40. Следовательно, рекомендация для универмага будет заключаться в том, чтобы ввести новый сервис интернет-магазинов.
Этот пример относится к одному образцу теста пропорций. Тем не менее, существует несколько типов тестов, которые зависят от знаний о населении и рассматриваемой проблемы.
Например, у нас есть t-тест, Z-тест. Тест хи-квадрат, тест Манна-Уитни, тест Вилкоксона и т. Д.
На этом я хотел бы завершить часть I «Все, что вам нужно знать о проверке гипотез». Я буду обсуждать параметрические и непараметрические тесты и какой тест использовать в каком сценарии в части II. До тех порСчастливого обучения…
Пожалуйста, поделитесь своим мнением в разделе комментариев ниже.
Если результат противоречит гипотезе значит вы сделали открытие
Если результат подтверждает гипотезу, значит, вы сделали измерение. Если результат противоречит гипотезе, вы сделали открытие.
Ферми начал систематическую бомбардировку в порядке периодической таблицы, взяв водород, литий, бор, углерод и азот. Результаты были отрицательными. Ученый немного упал духом: полученные данные заставили его сомневаться.
Тогда он решил попробовать новые элементы. Ферми пропустил кислород, потому что его бомбардировку надо было проводить в воде, и, бомбардируя фтор, сумел активировать элемент. Отреагировал счетчик Гейгера и на алюминий. Ферми отправил 25 марта 1934 года в журнал La ticerca sdentifica статью «Радиоактивность, наведенная нейтронной бомбардировкой. I», чтобы ее как можно скорее опубликовали.
В статье ученый давал интерпретацию полученных результатов для каждого элемента. Римская цифра I означала, что за этой статьей должны были последовать и другие из этой же серии, что и произошло.
Ферми понимал, что сила современной науки кроется в совместной работе. Он тут же подключил к новым исследованиям Амальди и Сегре. Помощники с энтузиазмом отнеслись к первым же результатам и предложили химику Оскару Д’Агостино присоединиться к ним (он как раз вернулся в Рим после работы в лаборатории Жолио-Кюри). Ферми отправил Разетти в Марокко телеграмму, в которой объяснял ситуацию и спрашивал, как приступать к сбору материала (речь шла обо всех элементах периодической таблицы!). Готовился поистине обширный эксперимент.
Команда исследовала более 60 элементов и открыла 40 новых радиоактивных изотопов. И это не все. При бомбардировке ядер более тяжелых элементов, тория (Z = 90) и урана (Z = 92), ученые обнаружили два новых элемента с атомным номером, превышающим 92. В статье Possible Production of Elements of Atomic Number Higher than 92 («Возможное образование элементов с атомным номером выше 92»), опубликованной в журнале Nature, элементы были названы гесперий и аузоний. Количество полученных данных и открытых радиоактивных элементов поразило группу исследователей. Возможно, поэтому ученые не обратили должного внимания на блестящую идею немецкого физика и химика Иды Ноддак (1896-1978) о возможности деления ядер урана на изотопы уже известных атомов. Время деления ядра еще не пришло.
В мае 1934 года Ферми предложил создавать искусственным образом несуществующие на Земле элементы, например элемент 93, который он, как ему казалось, получил в ходе некоторых экспериментов по бомбардировке урана. Корбино, выступая на конференции перед королем Виктором Имануилом III, рассказал о достижениях научной группы Ферми и обрисовал перспективу создания новых элементов. Фашистская пресса тут же подхватила эти слова, воздавая похвалы ученым и подчеркивая огромный вклад итальянской науки в развитие человечества — науки, «поощряемой фашистским режимом», и говоря об открытии элемента-93 как о свершившемся факте. Ферми очень рассердился на Корбино. Он не хотел никакой рекламы, особенно если речь шла о лжи мировому сообществу. Слишком много сил он потратил на то, чтобы заслужить репутацию, и ученый не хотел ее разрушить. Корбино понял сложность положения, однако было поздно: из скандальной европейской прессы новость докатилась до The New York Times.
МЕДЛЕННЫЕ НЕЙТРОНЫ
Осенью 1934 года Ферми поручил Амальди и Бруно Понтекорво подсчитать количество радиации, излучаемой каждым бомбардируемым элементом. Амальди тем летом был вместе с Сегре в Кембридже и опубликовал там в журнале Proceedings of the Royal Society анализ на тему «Радиоактивность, наведенная нейтронной бомбардировкой». Амальди знал, что условия эксперимента оказывали значительное влияние на количество испускаемой радиации.
Между 18 и 22 октября того же года Амальди и Понтекорво изучили поглощающие свойства таких материалов, как свинец, в зависимости от величины вещества и условий эксперимента. В свинцовую коробку они поставили цилиндр из серебра, а счетчик Гейгера разместили позади источника нейтронов радона-бериллия (см. рисунок на следующей странице). Ученые провели несколько опытов с цилиндрами одинаковых размеров, но из разных материалов, меняя их положение в коробке. Измеряемая радиоактивность менялась в зависимости от положения цилиндров, и ученые не понимали причин этого.
Амальди и Понтекорво поделились трудностями с Ферми и Разетти. Те изменили эксперименты так, чтобы устранить возможные причины ошибок: Разетти был уверен (и совершенно справедливо), что для уменьшения статистических ошибок нужна большая точность. Амальди вместе с Понтекорво поняли, что радиоактивность менялась в зависимости от того, проводились опыты на деревянном или мраморном столе. Тогда Ферми предложил проделать все то же самое вне свинцовой коробки: радиоактивность менялась даже при приближении металлических или других предметов. Тогда он посоветовал поместить между нейтронным источником и серебряным цилиндром различные материалы. Несколько дней все «ребята с улицы Панисперна» участвовали в опытах.
Некоторые свинцовые плиты, помещенные между источником и цилиндром, увеличивали радиоактивность. Тогда Ферми решил попробовать то же самое с блоком парафина, и радиоактивность выросла в огромное количество раз. Медленные нейтроны могли увеличивать радиоактивность.
Схема бомбардировки в эксперименте Ферми.
Объяснялось это так: при столкновении с легкими атомами, такими как атомы воды или парафина, некоторые нейтроны отдавали им часть своей энергии, не будучи при этом поглощенными, а затем, после нескольких