Что систематическая ошибка. Систематическая ошибка

Выборочное обследование

Создать выборку означает выбрать, кого опрашивать. Часто бывает невозможно и не нужно опрашивать всех членов целевого рынка, чтобы узнать мнение о том или ином вопросе, но важно опросить достаточное число людей нужного типа, чтобы полученные данные были вполне репрезентативными для рынка в целом.

Нахождение правильного состава респондентов имеет важное значение, поскольку исследователь пытается сделать выводы о целевом рынке в целом; во многих случаях при проведении обследования опрашивают мнение не более 100 респондентов, чтобы сделать выводы о потребителях, исчисляющихся миллионами. Это означает, что, когда наступит время анализа, небольшая ошибка в отборе выборки будет умножена многократно.

Рамочная выборка - это список респондентов, из которых исследователь хочет получить выборку. В некоторых случаях бывает, что такой список можно достать: например, если исследователь хочет выборочно обследовать мнение врачей, то он может получить список фамилий и адресов всех врачей страны. После этого будет относительно не сложно составить выборку из этого списка. Более вероятно, однако, что нужного исследователю списка взять негде, например списка людей, игравших в сквош (род упрощенного тенниса) за последние три месяца, которого, скорее всего, не существует. В таких случаях исследователю нужно составить репрезентативную выборку людей с требуемыми характеристиками. Это задание нередко бывает сложным .

В табл. 5.3 представлены некоторые методы создания выборки.

В последнее время наметился переход от использования вероятностных выборок к выборкам пропорциональным, при этом при создании выборок все шире применяются базы данных . Это вызвано тем, что пропорциональную выборку получить легче, полученные с ее помощью данные более надежны, а существование баз данных позволяет легко создавать выборки для почтовых опросов.

Таблица 5.8, Методы создания выборки

Метод

Описание

Преимущества

Недостатки

Случайная, или вероятностная, выборка

Каждый человек, входящий в население в целом, имеет одинаковые шансы быть включенным в выборку

Дает поперечный срез мнений населения

Почти невозможно достичь. Большинство так называемых "случайных" выборок имеют серьезные отклонения: например, выбор имен из телефонной книги может казаться случайным, но по сути в такую выборку будут включены только люди, имеющие телефон, и в нее не будут включены даже люди, просто не попавшие в справочник

Пропорциональная выборка

Сначала проводится анализ населения, часто с использованием данных переписи. Затем устанавливается квота для каждой категории (например, женщины в возрасте 35 лет, 20-летние мужчины, профессионалы среднего возраста), и интервьюерам велят придерживаться квот

Обеспечивает четкий поперечный срез мнений при условии правильного установления квот

Часто означает, что интервьюеры отметают респондентов из-за того, что они не подходят под квоты, и к концу дня интервьюеры нередко тратят много времени в поисках этого последнего "35-летнего работника физического труда с двумя детьми"

Стратифицированная выборка

Аналогична пропорциональной выборке в том смысле, что определяются широкие слои населения, но окончательный выбор респондента производится практически случайно

Менее расточительное отношение к респондентам, чем в случае пропорциональной выборки, больше гибкости для интервьюеров, а значит, такое обследование обходится дешевле

Точность ниже, чем в случае пропорциональной выборки

Техника интервью

При проведении опроса интервьюеру слишком просто "подвести" респондентов к "правильному" высказыванию. Иногда этому способствуют респонденты, сами задавая вопросы; хорошие интервьюеры избегают искушения вмешаться и помочь в этот момент.

Избежать этого можно, сказав, например: "Нам важно узнать именно ваше мнение. Что думаете вы?" или просто посмотрев вопросительно. Можно также порекомендовать заранее объяснить респондентам, что вы не сможете помочь им с ответами.

В случае использования фокус-групп или групповых глубинных интервью возникает проблема, связанная с необходимостью решить, следует ли продолжать ту или иную линию разговора или же оборвать ее. То, что на первый взгляд может показаться абсолютно не относящимся к делу отступлением от темы, может в конечном счете изменить направление дискуссии и позволить сделать какие-либо очень важные выводы; с другой стороны, если интервью превратится в общую болтовню, ничего полезного не получится. В некоторых случаях ведущий может просто спросить, как эта тема относится к предмету исследования. Иногда это позволяет получить быстрое объяснение связи или, в противном случае, быстро вернуться к теме обсуждения.

На практике группы, как правило, придерживаются обсуждаемой темы; отклонения случаются редко и длятся обычно недолго.

Источники систематических ошибок

Систематическая ошибка - это следствие воздействия, в результате которого та или иная внешняя сила делает обследование недостоверным.

Систематическая ошибка выборки

Это происходит, когда выборка является нерепрезентативной для изучаемого населения. Легко попасться в ловушку, думая, что выборка является репрезентативной, когда на самом деле она взята из маленькой популяции. Например, исследователь проводит опрос, допустим, на главной улице, останавливая каждого третьего посетителя магазинов. Это обследование не будет репрезентативным, поскольку оно включает лишь тех, кто пришел в этот день за покупками на главную улицу. Если такого рода обследование предпринято, к примеру, во вторник после полудня, в него может попасть в процентном отношении больше пенсионеров и безработных, чем присутствует во всем населении. Если аналогичное исследование будет проведено в субботу пополудни, то, скорее всего, в него не попадут спортивные болельщики.

Систематическая ошибка интервьюера

Это происходит, когда интервьюер хочет помочь респонденту ответить на вопрос. Интервьюеры, естественно, хотят пройти все вопросы анкеты с минимальными проблемами, к тому же они осознают, что у респондента есть чем заняться кроме того, чтобы отвечать на затруднительные или плохо сформулированные вопросы. Если интервьюер замечает, что респонденты проявляют отрицательную реакцию на некоторые вопросы, он может в будущем пропускать их и "угадывать" ответы. К сожалению, известно, что некоторые недобросовестные интервьюеры подделывают все ответы, если у них возникают трудности с нахождением достаточного количества респондентов для квоты .

Систематическая ошибка интервьюера может быть едва заметной; в не ограниченных временем интервью лицом к лицу "язык тела" интервьюера (выражение лица, жесты и пр.) может передать респонденту сигнал, который приведет к тому, что будет дан некий специфический ответ, или к тому, что часть информации не будет предоставлена.

Анализа необходимо по затраченному объему раствора H I и его концентрации вычислить из уравнения реакции соответствующее количество определяемой щелочи. Если концентрация раствора H I была в свое время определена неверно, то эта ошибка в качестве постоянной систематической ошибки отразится на всех результатах отдельных определений и, несмотря на хорошую воспроизводимость, полученные результаты будут совершенно неправильными. 


    По своему характеру ошибки анализа подразделяются на 1) систематические ошибки 2) случайные ошибки 3) промахи. 

Систематические ошибки. Систематическими ошибками называют погрешности, одинаковые по знаку, происходящие от определенных причин, влияющих на результат либо в сторону увеличения, либо в сторону уменьшения его. Систематические ошибки можно обычно предусмотреть и устранить их или же ввести соответствующие поправки. Отметим следующие виды систематических ошибок. 

Действительно, при этом условии все систематические ошибки определения будут совершенно одинаковыми в обоих случаях и на результате определения не отразятся. 

Т - истинное значение II - среднее значение III - систематическая ошибка IV - область случайных колебаний. 

Ошибки оперативные. Оперативные ошибки происходят от неправильного или недостаточно тщательного выполнения аналитических операций . Сюда относится, например, недостаточное промывание осадков , приводящее к постоянному завышению результатов, иногда - излишнее промывание осадков , приводящее к систематическим потерям. Систематические ошибки появляются также в результате недостаточной или чрезмерной продолжительности прокаливания осадков , недостаточно тщательного перенесения осадков из стакана в тигель, неправильного способа выливания растворов из пипеток и т. п. 

Систематическая ошибка обусловлена погрешностями измерительных устройств (что становится причиной получения слишком больших или малых значений измеряемой величины) либо неправильной методикой проведения измерений (например, пренебрежением влияния температуры окружающей среды , колебания атмосферного давления и т. п.). Систематическую ошибку можно компенсировать, вводя в расчет результата измерения соответствующие поправки. 

Как же надо обрабатывать результаты отдельных измерений (каждое из которых содержит случайную ошибку) для того, чтобы получить величину, более всего приближающуюся к точному значению Приступая к решению этой задачи, мы предполагаем, что систематические ошибки исключены. 

Систематические ошибки зависят от используемого метода или прибора иногда их называют методическими ошибками . Они связаны как с допущениями, принятыми при разработке метода измерения, так и с возможными смещениями показаний приборов (сдвиг пулевой точки и т. п.). Отличительной чертой таких ошибок является смещение измеряемых величин в одну сторону от

Очевидно, что применение математических методов не может дать ответ на вопрос, насколько у отличается от (х, если имеют место систематические ошибки физического метода . Математическая статистика в этом случае позволит лишь оценить область вокруг у, в которой могут находиться величины у[. Величина у будет хорошей оценкой х, если возможны только случайные ошибки только при этом условии справедлива левая часть соотношения (И-2). 

Случайными называются погрешности непостоянные по знаку и величине, вызываемые большим количеством случайных причин, которые приводят к рассеиванию размеров деталей относительно систематической ошибки. Появление случайных ошибок незакономерно, поэтому величину их нельзя определить заранее. 

Функциональные погрешности разделяются на определенные и неопределенные. Функционально определенные - это такие ошибки, величина и закономерность изменения которых может быть определена аналитически, т. е. они являются систематическими ошибками, изменяющимися по определенному закону. 

Выявляются и суммируются систематические ошибки (координаты середины полей допусков) для групп составляющих размеров, имеющих только скалярные ошибки - по формуле (39) векторные ошибки - по формуле (53) функционально связанные ошибки - по формуле (56) коррелятивно связанные ошибки- по формуле (59) силовые и температурные деформации - по формуле (60) зазоры -по формуле (70). 

Пример 3. Поле рассеивания отклонений непараллельности осей шатунных и коренных шеек коленчатого вала компрессора 4АУ-15 (фиг. 16) равно по величине допуску на изготовление, т. е. выбранный круглошлифовальный станок соответствует требуемой точности, но имеется значительная погрешность базирования валов в приспособлении (систематическая ошибка). 

Установлено, что нри определении концентраций веществ без систематической ошибки оценки констант , минимизирующие квадратичную форму Фз, будут несмещенными. Вычисление концентраций J производится или на основе интегральной формы кинетического уравнения , или численным интегрированием системы кинетических уравнений. 

Точки плана для построения полинома степени п выбирают таким образом, чтобы получить минимальную величину систематической ошибки, связанной с тем, что функция отклика есть полином степени Лг> . Принципы, используемые при выборе подходящих планов, были предложены ранее Боксом и Дрепером . 

Успех подобного подхода свидетельствует о том, что обсуждаемая поправка (на которую, вообще говоря, могут влиять и другие, не учитываемые здесь систематические ошибки) достаточно устойчива в пределах одного титрования. Такую устойчивость отмечали также Гордиенко и Сидоренко , применявшие поправки к pH при определении констант кислотно -основных равновесий. 

Все приведенные планы построены в предположении, что существует только систематическое смещение. На практике обычно кроме систематической ошибки экспериментальные данные содержат также и случайную ошибку. 

Основанное иа этих приемах планирование существенно снижает влияние не только случайных, но и систематических ошибок в первичных данных. Роль последних часто игнорируется без каких-либо оснований. Вместе с тем систематические ошибки могут приводить к полному обесцениванию конечны. результатов. 

Систематическая ошибка при измерении pH компенсируется соответствующим изменением коэффициента активности (подбором эффективного коэффициента активности). Пусть в нашем распоряжении есть алгоритм и программа для определения нескольких неизвестных констант ЗДМ по потенциометрическим (например, рН-метрическим) измерениям. Тогда никто не мешает включить в число неизвестных констант и константу формальной реакции получения отнесенной к базису частицы, активность которой мы измеряем. В логарифм этой константы войдет поправка, компенсирующая систематическую ошибку потенциометрических измерений. 

Оценку для систематической ошибки сдвига аналитического состава раствора Ах1. можно получить из уравнений материального баланса для закрытой системы с учетом изменения состава паровой фазы  

Загружаемые угли сушили в промышленных условиях с доведением остаточной влажности до 1-3%. Для получения индекса производительности на сухую массу /о экспериментальные величины корректировали, принимая относительное изменение индекса производительности равным 2,5% на каждый процент влажности. Выше говорилось, что этот коэффициент вариации , по-видимому, зависит от природы угля, поэтому получается систематическая ошибка в определении /ц, но она не превышает 1%. Напомним, что случайная ошибка средней загрузки (из шести) обычно составляет 2%, тогда общая ошибка - порядка 3%. 

Внутренние возмущения, систематические ошибки измерения Отказ отдельных подсистем, аварии 

Итак, величины / - содержат как ошибки измерений (будем считать их случайными), так и систематические ошибки, вызванные неадекватностью модели. 

Еще раз напомним, что величины е, вычисляемые описанным выше способом, характеризуют только влияние случайных, но не систематических ошибок анализа. Анализ может оказаться совершенно неправильным, несмотря на хорошую точность, т, е, на малую величину е, если при анализе были какие-либо систе матические ошибки. Отсутствие систематических ошибок может быть установлено сопоставлением разницы между полученным при анализе средним арифметическим () и истинным содержанием (а) определяемого элемента , т, е. ошибки А=х - а с е. Если Д

Систематические ошибки иногда можно установить по наличию некоторой постоянной тенденции. Так, если отклонение экспериментальных данных от средних величин распределено не случайно, а имеет в условиях эксперимента постоянную тенденцию, то можно ожидать систематической ошибки. Такое отклонение имеет значение, если оно больше ожидаемой ошибки в определении Предварительное обнаружение систематических ошибок требует некоторых навыков, так как для этого необходимо знание природы шаучаемой системы. 

Таким образом, небольшое значение е свидетельствует лишь о высокой точности измерений , но не об их правильности, так как все измерения могут содержать одну и ту же, и при этом значительную систематическую ошибку (например, вследствие неисправности прибора). Экспериментатор должен заранее позаботиться о том, чтобы такая ошибка была бы исключена (папример, устранением разрыва нити термометра Бекмапа). 

Рассмотрим причины, влияющие на ошибку измерения на примере с объемом газа, который упоминался выше. Ошибка измеряемого объема слагается из систематической ошибки и случайной ошибки измерения . Систематическая ошибка характеризует методическую правильность измерения , тогда как случайная ошибка определяется конкретными условиями отдельного измерения. Допустим, например, что объем газа измерялся при помощи 50-миллиметровой газовой бюретки . Указанный вьшде объем 

Систематические ошибки постоянны во всей серпи измерений или изменяются по определенному закону. Выявление их требует специальных исследований, но как только систематические ошибки обнаружены, они могут быть легко устранены введением соответствующих поправок в результаты измерения. 

Дри исследовании одноосновной кислоты средней силы последнюю реакцию в матрице (1) можно не учитывать. Напротив, опуская

Систематическая ошибка – это смягченное выражение, заменяющее слова «ошибка экспериментатора».

Систематические ошибки остаются, как правило, постоянными на протяжении всей серии опытов. Величина их может быть и известной, и неизвестной заранее. Например, курс шхуны «Пилигрим» содержал неизвестную Дику Сэнду, но известную Негоро систематическую ошибку.

Систематические погрешности могут быть обусловлены различными причинами:

· ограниченной точностью изготовления прибора (погрешностью прибора). Шкала линейки может быть нанесена неточно (неравномерно); взвешивание может производиться с помощью неточных гирь; положение нуля термометра может не соответствовать нулевой температуре; капилляр термометра может иметь разное сечение в разных участках шкалы; стрелка амперметра может не располагаться на нуле в отсутствие электрического тока через прибор;

· такие ошибки часто возникают из-за того, что реальная установка в чем-то отличается от идеальной, или условия эксперимента отличаются от предполагаемых теорией, а поправки на это несоответствие не делаются. Систематическая погрешность возникает при измерении массы, если не учитывается действие выталкивающей силы воздуха на взвешиваемое тело и на разновесы; при измерениях объема жидкости или газа, если не учитывается тепловое расширение; при калориметрических измерениях, если не учитывается теплообмен прибора с окружающей средой. Другими примерами эффектов, которыми может быть обусловлена обсуждаемая ошибка, являются термо-ЭДС в контактах, сопротивление подводящих проводов, «мертвое» время счетчиков частиц;

· систематические ошибки могут быть обусловлены также неправильным выбором метода измерений. Например, мы совершим такую ошибку, определяя плотность какого-то материала посредством измерений объема и веса образца, если этот образец содержит внутри пустоты, например, пузыри воздуха, попавшие туда при отливке;

· мы допускаем систематическую погрешность, округляя численную величину до какого-либо приближенного значения, например, полагая π = 3, π = 3.1, π = 3.14 и т. д. вместо π = 3.14159265…



При наличии скрытой систематической погрешности результат, приведенный с незначительной ошибкой, будет выглядеть вполне надежным, хотя на самом деле он является неверным.

Классическим примером может служить опыт Милликена по измерению элементарного электрического заряда e . В этом эксперименте требуется знать вязкость воздуха. Милликен взял заниженную величину вязкости и получил

e = (1.591 ± 0.002)∙10 - 19 Кл.

В настоящее же время принято значение

e = (1.60210 ± 0.00002)∙10 - 19 Кл.

Долгое время величины ряда других атомных констант, таких, как постоянная Планка и число Авогадро, базировались на значении элементарного электрического заряда e , полученном Милликеном, и, следовательно, содержали ошибку, превышающую 0.5 %.

Систематические ошибки не поддаются математическому анализу, и поэтому их нужно выявить и устранить . Если удается обнаружить причину и найти величину сдвига (например, вес вытесненного телом воздуха при точном взвешивании), то систематическую погрешность можно исключить введением поправки к измеренному значению. Однако общих рецептов и универсальных правил, позволяющих обнаружить систематические ошибки конкретного измерения, не существует Выявление, оценка и устранение таких ошибок требует опыта, догадки и интуиции экспериментатора. Нужно тщательно продумывать методику опытов и придирчиво выбирать аппаратуру. Иногда систематическую ошибку, обусловленную измерительным прибором, можно уменьшить, используя более точный прибор, желательно, другого типа. Наиболее действенный способ обнаружения систематических ошибок – это сравнение результатов измерений одной и той же величины, выполненных принципиально разными методами.

Случайная ошибка

Случайные ошибки проявляются в разбросе отсчетов при повторении измерений в одних и тех же доступных контролю условиях.

Величина случайных ошибок различна даже для измерений, выполненных одинаковым образом. Случайные ошибки происходят вследствие меняющихся от измерения к измерению неконтролируемых причин, действие которых неодинаково в каждом опыте и не всегда может быть учтено. Даже при взвешивании одними и теми же гирями мы, вообще говоря, будем получать разные значения веса. Источниками ошибок могут быть, например, колебания воздуха, воздействующие неодинаково на чашки весов; пылинка, осевшая на одну из чашек; нагревание одной половины коромысла от приближения руки взвешивающего; разное трение в правом и левом подвесах чашек и множество других причин, которые практически невозможно учесть. При измерениях периода колебаний маятника с помощью секундомера скажутся погрешности моментов пуска и остановки секундомера, ошибка в величине отсчета, небольшая неравномерность движения маятника вследствие трения. Случайные погрешности вызываются также сотрясениями здания. В опытах по измерению скорости радиоактивного распада ядер сама определяемая величина определена лишь статистически, как некоторое среднее значение, и флуктуации числа распадов в равные промежутки времени будут наблюдаться даже при идеально точной аппаратуре.

Проделав измерения и используя методы обработки, основанные на теории ошибок, можно дать оценку случайной ошибки и указать вероятность, с которой истинное значение измеряемой величины находится внутри некоторого доверительного интервала.

Случайную ошибку можно уменьшить путем многократного повторения измерений.

Промах

Следует особо выделить такой вид ошибок, как грубый просчет, или промах. Под промахом понимается ошибка, сделанная вследствие неверной записи показаний прибора, недосмотра экспериментатора, или вызванная неисправностями аппаратуры. Например, неправильно записанный отсчет, замыкание электрической цепи являются промахами, которых следует по возможности избегать.

В качестве примера промаха при взвешивании можно привести запись веса 100.20 г вместо 1000.20 г. При измерениях длины метровой линейкой промах может появиться, если один из концов измеряемого предмета окажется совмещенным не с нулевым делением линейки, а, скажем, с делением 10 см.

Если серия из небольшого числа измерений содержит грубую ошибку – промах, то наличие этого промаха может сильно исказить как среднее значение <x > измеряемой величины, так и погрешность измерения D.x . Поэтому такой промах необходимо исключить из окончательного результата. Обычно промах имеет значение, резко отличающееся от других данных. Иногда промах удается выявить, повторив измерение.

Для устранения промахов нужно соблюдать аккуратность и тщательность в работе и записи данных. Как правило, грубые ошибки могут быть обнаружены, поэтому результаты таких измерений следует отбрасывать.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

План

Введение

1. Систематическая ошибка

2. Ошибки выборки

3. Ошибки измерения

4. Ошибки дизайна и анализа

5. Ошибки в обнародовании результатов исследований

6. Методы контроля над систематическими ошибками

Литература

Введение

Часто исследование проводится с использованием не самого точного из существующих метода, позволяющего получить наиболее близкое к истинному значение измеряемой величины, поскольку такие референтные методы (дающие эталонное по точности измерение) обычно трудоемки, опасны, болезненны или дороги. Отклонения результатов измерения от истинного значения являются ошибками (погрешностями) измерения независимо от причины отклонения. Случайная ошибка -- отклонения от истинной величины, которые в среднем равны нулю, т.е. не изменяют измеряемой величины. Случайная ошибка затрудняет выявление закономерностей, но ее наличие не сказывается на направлении и величине сдвигов (различий, связей), выявляемых в исследовании, конечно, при условии, что проведено множество измерений.

ОШИБКА СИСТЕМАТИЧЕСКАЯ - син. смещение (BIAS) -- отклонение выводов от истины или процесс, приводящий к подобному отклонению. Любое уклонение (искажение) в сборе, анализе, интерпретации, публикации или обзоре данных, ведущее к выводам, которые систематически отличаются от истины. Среди путей, ведущих к отклонениям от истины, можно выделить: систематический ошибка исследование выборка

Систематическое (одностороннее) отклонение результатов измерений от истинных величин (систематическая ошибка в узком смысле).

Отклонение суммарных статистических оценок (средних, частот, мер связи и т.д.) от их истинных значений в результате систематического отклонения результатов измерений, других погрешностей в сборе данных или погрешностей в дизайне исследования или анализе данных.

Отклонение выводов от истины в связи с недостатками дизайна исследования, сбора данных, анализа или интерпретации результатов.

Тенденция процедур (в дизайне исследования, при сборе данных, анализе, интерпретации, обзоре или публикации результатов) давать результаты или выводы, отклоняющиеся от истины.

Предубеждения, вызывающие сознательный или неосознанный отбор процедур исследования, ведущих к отклонению от истины в определенном направлении или к односторонней интерпретации результатов.

Термин систематическая ошибка не обязательно предполагает обвинения в предубежденности или наличии другого субъективного фактора, такого, как желание получить определенный результат. Это отличает данный термин (bias) от его традиционного значения -- пристрастная точка зрения. Описано множество разновидностей систематических ошибок.

1. Систематическая ошибка

Систематическая ошибка может быть обусловлена:

назначением препаратов с учетом прогноза врачи по-разному подходят к назначению терапии при различном прогнозе В таких случаях сравнение результатов в основной и контрольной группах приведет к неправильной оценке эффекта лечения

методами регистрации данных, возникает при использовании в сравниваемых группах различных подходов к регистрации данных (с помощью компьютера и вручную)

выявлением определенного исхода, возникает при более тщательном выявлении изучаемого клинического исхода в одной из сравниваемых групп

использованием изучаемого диагностического метода в комплексном обследовании, результаты которого рассматриваются как «золотой стандарт» для оценки этого метода

более тщательным опросом участников одной из сравниваемых групп;

предпочтительной публикацией положительных результатов, возникает, если вероятность публикации полученных данных зависит от того, выявляют ли они клиническую и статистическую значимость эффекта вмешательства

влиянием клинического исхода на воспоминания о воздействии, возникает вследствие того, что участники, у которых возникли изучаемые клинические исходы, чаще вспоминают о соответствующем вредном воздействии, чем участники из контрольной группы; независимо от реальных наличия, длительности и интенсивности воздействия;

влиянием ожидаемого исхода на особенности исследования, синоним систематической ошибки, связанной с выявлением определенного исхода; возникает при более тщательном выявлении клинического исхода в одной из сравниваемых групп;

подтверждением диагноза, возникает, если результаты диагностического теста влияют на включение участника в группу вмешательства.

СИСТЕМАТИЧЕСКАЯ ОШИБКА ОТБОРА (SELECTION BIAS) -- ошибка, вызванная систематическими различиями характеристик у тех, кто принимает участие в исследовании, и тех, кто в нем не участвует. Пример: систематическая ошибка отбора возникает, когда участники исследования ограничены добровольцами или людьми, находящимися в конкретном месте в конкретное время, или больничными пациентами, находящиеся под наблюдением врача, и из их числа исключены те, кто умер до госпитализации из-за острого течения их заболевания; кто еще не достаточно болен для того, чтобы нуждаться в госпитализации, и те, кто был исключен из соображений стоимости, расстояния или других факторов. Систематическая ошибка отбора делает несостоятельными выводы и обобщения, которые в противном случае могли быть сделаны в результате таких исследований. Это часто возникающая и нередко игнорируемая проблема.

2. Ошибки выборки

СО выборки (sampling bias) -- СО, возникающая в результате изучения неслучайной выборки. Ее не следует путать с ошибкой выборки (sampling error), которая является частью общей ошибки оценки параметра, возникающей из-за случайного характера выборки. Ошибка выборки случайна, она возникает как проявление того, что каждая случайная выборка из популяции отличается (вариабельность выборочных результатов, sampling variation).

Ошибка обращаемости (ascertainment bias) -- СО, связанная с включением в исследуемую выборку лиц или случаев, не представляющих равным образом все классы (подгруппы) популяции. Причины этой СО разнообразны. Это может быть особенность источника, откуда поступают обследуемые лица, например, поликлиника завода (в результате выборка не будет отражать состояние здоровья населения).Это может быть способ выявления людей, их особенностей, в частности диагнозов, на который могут влиять обычаи и культура.

СО отбора (selection bias) -- ошибка, вызванная систематическими различиями характеристик у тех, кто принимает участие в исследовании и теми, кто в нем не участвует. Такая ошибка возникает в исследовании, в которое включают только добровольцев (они отличны от тех, кто не пожелал участвовать) или только госпитализированных пациентов, находящихся под наблюдением врача (исключены те, кто умер до госпитализации из-за тяжелого течения заболевания, и те, кто еще недостаточно болен для того, чтобы нуждаться в госпитализации, и те, кто из-за стоимости лечения или расстояния не был госпитализирован). В результате СО отбора могут возникать ложные связи и замаскировываться реально существующие. СО отбора -- очень частая проблема, многообразная в своих проявлениях.

СО отклика (response bias) -- СО, вызванная различиями в характеристиках тех, кто добровольно вызвался принять участие в исследовании, и тех, кто отказался.

СО вследствие выбывания из исследования (bias due to withdrawals) -- СО, возникающая вследствие различия между величинами истинными и величинами, полученными в исследовании, в результате особенных характеристик участников, вышедших из исследования. Например, при изучении катамнеза не удается найти часть больных. Изучение характеристик только тех, кого удалось найти, может давать искаженное представление даже о таких показателях, как смертность.

СО серии вскрытий (bias in autopsy series) -- СО в оценке патологоанатомической картины, возникающая в результате того, что вскрытые умершие являются нерандомизированной выборкой из всех смертных случаев. Например, при анализе текущих результатов патологоанатомических вскрытий нельзя не учитывать, что патологоанатомы изучают только половину умерших. Лекции по математической статистике. Возможно, что в «невидимой» половине и структура причин смерти, и частота расхождений с клиническим диагнозом иные.

СО распределения пациентов (allocation bias) -- в экспериментальных исследованиях методов лечения возможно неравное распределение пациентов между сравниваемыми группами, в результате, например, сравнивается частота или скорость выздоровления у «легких» больных, получающих новое вмешательство, с аналогичными признаками у более тяжелых больных, получающих стандартное лечение.

3. Ошибки измерения

СО инструментального измерения (bias due to instrumental error) -- СО, возникающая вследствие недостатка измерительного прибора, дефектов его калибровки, использования недоброкачественных реактивов, неправильных технологий измерения и т.д.

Феномен предпочтения чисел (digit preference) -- предпочтение определенных чисел, обычно приводящее к округлению измерений. Округление может производиться до ближайшего целого числа, дробного числа, кратного 5 или 10, а при других единицах измерения -- соответственно им, например, при измерении неделями -- 7, 14 дней, при оценке интенсивности курения - до 20 (пачки, Рис. 2) и т.д. Предпочтение чисел может быть свойством лица, отвечающего на вопросы в обследовании, или формой ошибки наблюдателя. Например, курильщики на вопрос о количестве выкуриваемых сигарет бессознательно округляют до 5, так же поступают обычно врачи, регистрируя результаты измерения артериального давления.

СО представления данных (bias in the presentation of data) -- ошибка в результате неоднородностей, вызванных предпочтением чисел, неполнотой данных, некачественными лабораторными процессами, плохими методами измерения.

СО информации (information bias, син.: observational bias -- СО наблюдения) -- в результате погрешностей в процедуре наблюдения или оценки в сравниваемых группах могут возникать разные ошибки, и, соответственно, может возникнуть (или быть скрыто) различие между группами или зависимость. Э. Васильева. Выборочный метод в социально-экономической статистике.

СО интервьюера (interviewer bias) -- СО, возникающая, когда человек, проводящий опрос, подсознательно или сознательно избирательно регистрирует неполную или искаженную информацию. Это может быть следствием того, что интервьюер не владеет языком опрашиваемых, имеет предрассудки, а также иными причинами.

СО наблюдателя (observer bias) -- систематическое различие истинных значений и наблюдаемых результатов, из-за ошибки наблюдателя. Человек не только использует инструменты, но и сам в жизни и в исследовании выступает как инструмент в оценке времени, определении момента возникновения явления, наличия явления (например, тени, осадка, кристаллов). В этом качестве человек дает результаты, в которых обязательно присутствует случайная ошибка. Последнюю называют ошибкой наблюдателя (observer variation, observer error). Наличие ошибки наблюдателя часто недооценивается. Между тем, общее правило гласит, что все наблюдения подвержены вариациям, и всегда следует ожидать, что будут иметься расхождения между повторными наблюдениями одного исследователя и расхождения между исследователями.

Вариации можно уменьшить, но полностью их избежать невозможно. Причины ошибок наблюдателя бесконечны. Исследователь может не заметить отклонение или думать, что обнаруженного не существует; измерение или тест могут дать неверные результаты из-за ошибочного метода или неверного прочтения и записи данных; исследователь может неверно интерпретировать образ или наблюдение. Выделяют две разновидности ошибки наблюдателя: вариации результатов исследователей (interobserver variation, т.е., различия результатов измерений разными исследователями) и вариация результатов одного исследователя (intraobserver variation, т.е. различия результатов в серии измерений одного и того же объекта, проделанной одним исследователем).

Всю совокупность ошибок наблюдателя (случайную и систематическую ошибки) можно в значительной степени устранить, если измерения проводить параллельно и независимо двумя или более исследователями. Поскольку ошибки исследователей в основном независимы, то расхождения измерений (оценок) укажут на такие ошибки. Эти ошибки станет возможным устранить, для чего существуют разные методы, из которых простейший -- вычисление средней оценки. Возможно возникновение специфической СО наблюдателя (или СО измерения) в оценке методов лечения. Если при тяжелом заболевании испытывается новый способ лечения в открытом эксперименте, пациенты, получающие новое (дорогое или недоступное другим) вмешательство, могут выше оценивать результаты лечения в сравнении с пациентами контрольной группы, получающими стандартное вмешательство.

СО памяти (recall bias) -- СО, возникающая вследствие различия в точности или полноте воспоминаний о прошлых событиях или жизненном опыте. Например, больной человек лучше, чем здоровый, может вспомнить события, потенциально связанные с возникновением заболевания .

СО сообщения информации пациентом (reporting bias) -- СО вследствие выборочного сообщения или сокрытия информации о прошлой истории болезни, например, о деталях половой жизни. Обычно эта СО проявляется в сокрытии общественно осуждаемых форм поведения и может возникать не только при изучении пациентов, людей в популяции, но и при изучении поведения врачей.

СО в обращении с выпадающими величинами (bias in the handling outliers) -- СО, возникающая вследствие включением в анализ необычных (выпадающих из общего ряда) значений в маленькой выборке или же вследствие исключения из анализа необычных значений, которые следовало включить.

4. Ошибки дизайна и анализа

СО опережения (lead time bias, син. zero time shift -- сдвиг точки отсчета). Обычным в медицинской практике является стремление к выявлению заболевания ранее обычного (интервал опережения, lead time), например, до возникновения симптомов. Б. Миркин. Группировки в социально-экономических исследованиях Предполагается, что лечение в этом случае будет более успешным, и это увеличит выживание. Если выживание измеряется временем от выявления болезни до смерти, то ранняя диагностика может создавать иллюзию увеличения выживания за счет того, что болезнь будет просто выявляться раньше, т.е. возникает переоценка времени выживания из-за сдвига назад точки отсчета выживания. Для надежного выявления истинного характера увеличения длительности выживания после диагностики необходимы сравнительные экспериментальные исследования. В более общем случае СО опережения возникает, когда наблюдения за группами пациентов начинаются на несравниваемых стадиях естественного развития заболевания. Например, вмешательства у женщин, страдающих раком молочной железы, который выявляется путем скрининга, нельзя сравнивать с вмешательствами у женщин, болезнь которых выявляется клиническим осмотром при обращении на более поздней стадии болезни.

СО продолжительности (length bias) -- СО, возникающая при изучении болезни на выборке преваленсных случаев (всех случаев, найденных в популяции или в регистре. В такой выборке оказываются преимущественно представлены длительно текущие случаи. СО продолжительности может возникать не только в поперечном исследовании, но и в когортном по ретроспективно собранным данным, в исследовании типа сравнения с контролем и других.

СО дизайна (design bias) -- различие между истинной величиной, например, величиной эффекта ЛС, и величиной, полученной в результате неправильного дизайна исследования. Например, в неконтролируемом исследовании терапевтического эффекта ЛС может быть невозможно отличить влияние на исход болезни ЛС и более высокого дохода у тех, кто мог оплатить это ЛС. В некоторых случаях, применительно к отдельным особенностям дизайна их влияние на оценку исхода известно (это называют «эффект дизайна»). Например, если требуется изучить влияние правил ведения больных врачом на исходы, то не совсем правильно предложить врачу вести больных разными способами (опытную группу -- так, а контрольную -- иначе). При этом все больные неизбежно начинают получать некое «усредненное» лечение.

Правильнее рандомизировать врачей, и тогда больные одного врача будут получать одно лечение, а больные другого -- другое. Это называется кластерным дизайном. При кластерном дизайне выявляемый эффект (разница в исходах при двух вмешательствах) больше, но для достижения статистической значимости эффекта необходимо больше пациентов, чем было бы необходимо при обычном дизайне (параллельном, простая случайная выборка) и равной величине эффекта. Это отличие в результатах исследования, зависящее от особенностей дизайна, называют эффектом дизайна. Отдельные дизайны более, чем другие, подвержены ВВФ. Так, в исследованиях сравнения с контролем и обсервационных исследованиях ВВФ больше и спектр возможных смещений шире, чем в экспериментальных исследованиях типа двойных слепых контролируемых испытаний. СО дизайна не следует путать с подверженностью отдельных дизайнов разным систематическим ошибкам. Например, описания серии случаев и исследования типа сравнения с контролем, сравнения с историческим контролем и с географическим (внешним) контролем подвержены широкой гамме СО. В сравнении с этими дизайнами проспективные контролируемые испытания, в особенности рандомизированные слепые испытания, лучше защищены от возникновения СО, поскольку в этот дизайн встроены несколько механизмов защиты от возможных СО.

Ошибка Берксона (Berkson"s bias, Berkson"s fallacy) -- разновидность СО отбора, которая возникает из-за того, что в исследовании типа случай-контроль исследуемые и контрольные лица систематически отличаются друг от друга. Например, так происходит случаях, когда изучаемая экспозиция (воздействие) повышает риск госпитализации при данной болезни, а не риск болезни. Это систематически приводит к повышению частоты экспозиции у госпитализированных больных по сравнению с пациентами контрольной группы, также находящимися в стационаре; в свою очередь, это увеличивает отношение шансов. Елисеева И. Теория статистики с оновами теории вероятностей Например, если у летчиков обнаружение изменений позвоночника приводит к обязательной госпитализации, а у других авиационных специалистов -- обычно к амбулаторному обследованию, тогда сравнение летчиков в стационаре с другими пациентами выявит связь профессии с изменениями позвоночника.

СО выявления (detection bias) -- СО в результате систематической погрешности в методах выявления, диагностики или верификации случаев в исследовании. Например, больные, отобранные для исследования в первичной практике, отличаются от отобранных в больнице, поскольку в последней доступны специальные лабораторные тесты. Вариант: СО спектра патологии . При исследовании нового диагностического теста его точность в выявлении патологии может выглядеть высокой. В действительности это успешное выявление больных, например, раком простаты, может быть связано с тем, что контрольную группу составляли студенты-медики, а группу больных -- больные с диагнозом, верифицированным на операции. Как только метод будет применен в группе пожилых мужчин для выявления относительно ранних случаев рака, может оказаться, что его возможности в выявлении больных невелики.

СО диагностической проработки (workup bias) -- СО, вызванная неверным или неполным выявлением случаев, более частым в одной группе исследования. Обычно это происходит потому, что пациенты с положительным результатом первого теста, используемого вначале, получают более тщательное обследование при дальнейшей диагностике, чем те пациенты, у которых результат первого теста был отрицательным. При сопоставлении заболеваемости в профессиональных группах эти группы могут иметь различный доступ к диагностическим технологиям.

СО предположения (bias in the assumption, cин. conceptual bias -- концептуальная ошибка) -- ошибка в результате неверной логики. Ложные выводы об объяснениях ассоциации между переменными. Неоднократно документировано, как исследователь переносит на новый объект концепции, оказавшиеся плодотворными в предыдущем исследовании.

СО интерпретации (bias of interpretation) -- СО в выводе и толковании. Возникает вследствие ограниченной возможности исследователя рассмотреть все возможные интерпретации, соответствующие фактам, и оценить достоинства каждого из них или вследствие пренебрежение случаями, которые представляют собой исключения из общего вывода.

Феномен регрессии к средней,который проявляется во всех продольных исследованиях. Вследствие действия случайных факторов аналитического происхождения и вследствие временных изменений в состоянии людей (например, легкое инфекционое заболевание), получаемые при измерении величины могут быть завышены, занижены, или соответствовать долговременным (постоянным) индивидуальным особенностям. Происхождение регрессии к средней следующее. Если величина, измеренная в первый раз, не была существенно смещена вследствие аналитических или внутрииндивидуальных вариаций, то при следующем изменении она изменится непредсказуемо, в среднем для таких субъектов не изменится никак. Если же величина была завышена, то она в следующий раз будет примерно средней, т.е. приблизится к средней относительно первого значения. Чем более она была завышена (например, вследствие большой аналитической ошибки), тем больше она сдвинется к средней, типичной для популяции величине. В случаях, где наблюдалась заниженная вследствие аналитических и внутрииндивидуальных колебаний величина, тоже будет сдвиг к средней -- повышение. Если бы имели место только аналитические вариации, то регрессия к средней полностью реализовывалась бы при втором измерении. Поскольку внутрииндивидуальные вариации могут быть долгосрочными, постольку возврат к средней, например, после болезни или после изменения образа жизни в связи со сменой работы, может занимать месяцы и годы.

Экологическая ошибка (ecological fallacy). Для выявления связи экспозиции и заболевания можно сопоставлять экспозицию у отдельных людей с возникновением у них болезней, а можно сопоставлять экспозицию популяций (стран) с заболеваемостью в этих странах. Исследования второго типа называют экологическими. На основании связи между национальным потреблением соли и распространенностью язвенной болезни желудка и двенадцатиперстной кишки в большом числе стран можно предположить наличие между этими явлениями причинной связи. Можно далее сделать выводы относительно необходимых мер профилактики. Это было бы типичной экологической ошибкой -- перенесением на возникновение болезней у отдельных людей закономерностей, полученных в экологических исследованиях. Множество связей, найденных в экологических исследованиях, не были подтверждены на индивидуальном уровне. Противоположная ошибка -- перенос на уровень популяции закономерностей, изученных на отдельных людях (атомистическая СО).

Ошибки в обнародовании результатов исследований

Специалисты и публика, использующие медицинскую и иную научную литературу, склонны рассматривать ее как совокупность относительно объективных научных сообщений, которые в большей или меньшей степени точно отвечают на поставленные вопросы. M. Barnes. Bioinformatics for Geneticists. Это расхожее представление соответствует предположению о том, что научные статьи могут содержать ошибочную информацию с элементом случайной ошибки. В действительности истина, открывающаяся в научных исследованиях, отражается в публикациях не только со случайно ошибкой, но и с рядом СО. Эти ошибки в совокупности называют СО обнародования (по-английски используется термин reporting bias, который относится также к ошибке сообщения информации пациентом). В целом СО обнародования создают медицинским научным журналам специфический облик витрины непрекращающихся сообщений об успехах в диагностике и лечении.

Главная из ошибок обнародования -- публикационная СО (publication bias) . В основном она состоит в том, что не все результаты исследований публикуются (обнародуются). Публикуются чаще те исследования, которые принесли положительные результаты, т.е., в выгодном свете представляют новое лечение. ЭСО обнародования присуща не только результатам экспериментальных исследований, но и всех других. Везде, где есть хоть какой-то стимул для разного отношения исследователя или спонсора к разным результатам исследования, возникают систематические ошибки. Исследователь работает, в той или иной мере отдавая предпочтение рабочей гипотезе. Если она не подтверждается, то это ведет к разочарованию, потере интереса к опубликованию. Опубликование статьи -- это трудный процесс, и нужно хотеть, чтобы оно состоялось . Неопубликование данных исследования -- не просто нарушение принципов научного поиска. Это может быть опасным. Так, в 80-х годах ХХ века группа авторов исследовали антиаритмическое ЛС. В группе пациентов, которые его получали, обнаружилась высокая летальность. Авторы расценили это как случайность, и, поскольку разработка этого антиаритмического ЛС была прекращена, то публиковать материалы не стали. Позднее подобное антиаритмическое ЛС -- флекаинид -- стало причиной гибели множества людей

Система, в которой работает исследователь, может подталкивать к обнародованию только положительных результатов. Например, русская диссертационная система не принимает «отрицательных» результатов. В 2004 г. МЖМП опубликовал призыв сообщить о прецеденте защиты диссертации с отрицательным выводом по основному положению, но, несмотря на обещание премии, так ни одного сообщения и не получил. Но самый важный фактор, определяющий отказ от обнародования -- интересы спонсора. Классический пример -- отказ от опубликования результатов фармацевтическими компаниями в случае, когда исследование приносит отрицательный результат. Наоборот, положительный результат, хорошо отражающийся на продажах, может многократно повторно публиковаться . Этот механизм, конечно же, характерен не только для фармацевтических компаний. Производители оборудования ведут себя таким же образом. Производители табака точно так же финансируют исследования и публикуют избирательно то, что им выгодно . СО обнародования не относится только к контролируемым испытаниям. Она присутствует в исследованиях всех дизайнов.

Для отдельно взятого читателя, знакомящегося с отдельно взятой статьей или несколькими статьями, наличие публикационной СО незаметно, как незаметны микроорганизмы на коже. Трудно представить, что статья, на чтение которой ты нашел время, оказалась перед твоими глазами не потому, что она важна, а потому, что спонсор потратил средства на ее повторное опубликование, на напечатание отдельных оттисков, раздаваемых на конференции бесплатно, на гонорар профессору, который эту статью упомянул в лекции. Именно поэтому на первом месте у врача должен быть поиск защищенной от СО информации, прежде всего -- систематических обзоров. Точно так же у исследователя на первом месте должна быть не работа с «образцом» какого-то предшествующего исследования, а работа с совокупностью предшествующих данных. Поэтому каждый исследователь на этапе планирования работы должен выполнить систематический обзор предшествующих исследований по изучаемому вопросу.

Помимо основного фактора -- результата исследования -- на вероятность опубликования влияют и иные факторы.

Языковое смещение. По понятным причинам исследования, исходящие из англоязычных стран Запада, легче находят путь на страницы ведущих международных англоязычных журналов. С этой СО тесно связана СО финансирования -- исследования, имеющие существенное финансирование, публикуются чаще, чем исследования инициативные, не финансируемые извне. D. Wilks. Statistical Methods in the Atmospheric Sciences. Здесь имеет значение не только фактор обязательств исследователя перед спонсором, но и ограниченность собственных средств исследователя. Последний может найти время для инициативного исследования, но, получив «отрицательный» результат, не найти более времени для того, чтобы трудиться над его опубликованием. Близка к языковой и «СО развивающихся стран» -- известная трудность для исследователей из развивающихся стран опубликоваться в международных журналах. Интересно, что в основе этой СО лежит недоверие редакторов к исследованиям из развивающихся стран. Это не мешает периодической публикации в лучших журналах одиозных фальсифицированных исследований из этих стран.

Сами авторы оказывают влияние на то, какие исследования, будучи обнародованными, присутствуют в обороте. Например, статья из провинциального русского журнала, будучи процитированной в другой статье, опубликованной в международном журнале, включается в научный оборот. Если этого не произойдет, то статьи из журнала, не индексируемого в международных базах данных, останутся вне мирового научного оборота.

Исследователь, выполняющий систематический обзор, также может внести СО в его результаты. Поэтому систематические обзоры также должны оцениваться читателями критически. Прежде всего, такая ошибка возникает за счет манипулирования критериями включения и исключения исследований из обзора. Этим широко пользуются сегодня производители ЛС, оборудования, предметов ухода для того, чтобы с помощью систематического обзора показать преимущество своего продукта. Самый известный пример -- спонсирование производителями альбумина обзора с результатами, отличающимися от обзора, показавшего неэффективность инфузий альбумина при тяжелой травме.

СО отсрочки публикации. Все исследования, имеющие меньшие шансы на опубликование, одновременно еще и позднее публикуются. В целом, чем менее «поразителен» результат, чем меньше он нужен спонсору и самому исследователю, тем позднее он публикуется. Для инициативных исследований отсрочка в опубликовании может составлять многие годы.

СО сообщаемого исхода (outcome variable selection bias). В зависимости от интересов исследователя и по иным причинам в опубликованных отчетах могут фигурировать в первую очередь те изученные признаки, которые наиболее привлекательны, лучше приемлемы для «передового» журнала, или лучше подтверждают интересы спонсора. Например, в медицине вполне обычно опубликование результатов исследования с позитивной оценкой некоего вмешательства на основании только измерения толщины интимы артерии или изменения концентрации отдельных липопротеидов, в то время, как клинически важные исходы могут не сообщаться, сообщаться не полностью, или сообщаться в более поздних публикациях. Обычно это связано с тем, что в значительной части исследований удается обнаружить «интересные» изменения в биохимических параметрах, но не в смертности, качестве жизни, инвалидности больных.Методы контроля над систематическими ошибками

На этапе дизайна исследования

Выбор популяции исследования первый и важнейший этап создания исследования. Этот выбор определяет прежде всего то, насколько актуален будет его результат. Выбор неверной популяции, редкой, с особенными свойствами, может привести к тому, что результат даже правильный, будет никому не нужен (не обладать внешней валидностью). Выбор популяции, в которой заболевание встречается редко, может привести к тому, что исследование, направленное на выяснение вреда загрязнения питьевой воды, вреда этого не обнаружит - удвоение частоты от 2/100 000 до 4/100 000 окажется статистически незначимым. Д. Перкус. Математический анализ генома. Выбор источников информации в значительной степени определяет, что удастся найти. Например, если государственная статистика не регистрирует внезапную смерть новорожденных, то нелепо ориентироваться на нее в изучении этой и подобных патологий. Если статистика смертности от рака не предусматривает возможности исправления причин смерти задним числом, по мере установления окончательной причины смерти, то использование такой государственной статистики дает лишь ориентировочные представления об онкологической заболеваемости и смертности.На этапе дизайна исследования, составления его протокола должны уточняться все детали выполнения работ на каждом из последующих этапов. Здесь лишь для удобства приемы повышения надежности исследования разнесены по этапам.

5. Ошибки в обнародовании результатов исследований

Стандартизация методов сбора информации. Лишь на первый взгляд измерение выполняется просто. В действительности для получения не высококлассных, но даже обычных по точности и воспроизводимости результатов необходимо предпринимать значительные усилия для выработки правильного метода измерения и обеспечения правильного измерения всеми участниками исследования. Это относится не только к приборным измерениям, но и к измерениям, выполняемым с помощью опроса. Даже отлично разработанный и проверенный набор вопросов должен предъявляться опрашиваемым в стандартной обстановке, со стандартными вводными словами, поскольку отсутствие атмосферы приватности или выражение отношения к содержанию или форме вопросника способны изменить существенно отношение опрашиваемого к заданным вопросам. Невинная прибаутка, добавляемая интервьюером может улучшить отношение опрашиваемого к процессу, но радикально изменить его отношение ко всем или отдельным вопросам вопросника.

Поскольку обобщение результатов проведенных исследований (систематический обзор) представляет собою технологию дескриптивного исследования, в котором в качестве единиц анализа выступают не люди, а отдельные исследования, постольку систематический обзор весьма сильно подвержен всем смещениям, характерным для дескриптивных исследований. Основными приемами, которые позволяют минимизировать смещения в систематическом обзоре, являются получение максимально полного набора выполненных исследований. Поскольку никогда не известно, сколько исследований выполнено в действительности, единственное приемлемое решение - искать все исследования и получать данные из всех исследований. Как упоминалось выше, получить несмещенную выборку все равно невозможно, но минимизировать смещения - возможно.

Для того, чтобы избежать субъективности в оценках, выносимых по рентгенограммам, оценке текстов или собеседованиям (интервью), традиционно применяется прием повторной оценки одного и того же объекта разными людьми. Если это проводится без обеспечения независимости, то результаты таких повторных оценок будут искусственно согласованы. Например, если психиатр-консультант знаком с мнением коллег, уже исследовавших пациента, то мнение консультанта будет находиться под влиянием этого мнения и, в обычных обстоятельствах, согласовано с ним. Для обеспечения независимости всякая параллельная оценка должна проводиться без знания оценивающим результатов работы других специалистов. Например, независимая оценка рентгенограммы очень часто приводит к несогласию врачей, настолько часто, что врачи, никогда не принимавшие участия в такой работе, не могут этого себе представить - примерно в половине случаев.Это справедливо для оценок ЭКГ и всех других измерений.При изучении опубликованных статей обычно кажется ясным, что в них написано. Однако при выписывании из статей их результатов в таблицы для обобщения в систематическом обзоре оказывается, что два врача при чтении статей выписывают разные результаты! Существенные расхождения в извлечении содержания статьи возникают в каждом третьем случае. Лишь при целенаправленной тренировке - оценке статей и затем сравнении результатов - можно добиться того, что частота расхождений снижается примерно до 1/10.

Метод ослепления (маскирование). Для того, чтобы сравниваемые результаты измерения были по-настоящему независимыми, специалисты, проводящие измерение, должны работать, не зная результатов работы друг друга до момента завершения каждого случая. По его завершении результаты должны сравниваться, и в случае обнаружения расхождения это расхождение преодолеваться. Для этого существуют специальные процедуры. Простейшая состоит в ознакомлении с результатами параллельной оценки и обсуждении расхождения. Если расхождение связано с тем, что один из участников процесса упустил некую информацию, деталь, то легко возникает согласованное мнение. В некоторых случаях этого недостаточно и разрабатывается процедура с приглашением третьего специалиста, который, например, знакомится со всеми результатами и выносит свое решение, или, в свою очередь, принимает участие в голосовании. Иногда эти правила принятия согласованного мнения могут быть более сложными.

Метод ослепления - основной метод создания одинаковых групп для сравнения и обеспечения одинакового ведения пациентов. Всякий раз, когда о пациентах известно хоть что-нибудь, то отношение к ним становится соответствующим. Это вытекает из самой природы человеческих отношений. С. Кункин. МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ Мужчина и женщина, бедный и богатый, здоровый и больной не могут и не должны рассчитывать на то, что к ним будет совершенно одинаковое отношение. Эти особенности отношений не только создают «атмосферу», но и влияют на то, что делают медицинские и немедицинские специалисты. В изучении медицинских вмешательств идея о том, что сравнивать два вмешательства можно только в том случае, когда их применяли к одинаковым пациентам, уходит в прошлое по крайней мере на 200 лет. Беда заключалась в том, что в эти давние времена было неизвестно, что делать, если сравниваемые группы несравнимы. И сегодня врач, собрав данные о лечении пациентов одной болезнью разными методами, например, рентгеновским излучением и протонным, обнаруживает, что группа пациентов, которых облучали пучком протонов, отличается от тех, кого облучали рентгеновскими лучами меньшим размером опухоли.Можно ли по исходам лечения сделать вывод о том, какое облучение эффективнее? Конечно же - нет. Исключение составляют случаи, когда эффект в сравниваемых группах различается многократно (см. выше - влияние вмешивающихся факторов обычно не очень велико) или когда можно внести поправку на обнаруженное различие. К сожалению, в большинстве случаев внесение поправки, например, на тяжесть болезни или возраст, невозможно по причине малого числа пациентов. С другой стороны, внесение поправки на известный признак, по которому обнаружено различие, совсем не исключает наличия других, невидимых исследователю различий между группами. Например, можно внести поправку на длительность болезни до начала лечения, но одновременно группы могут различаться еще и по особенностям раковых клеток, неизвестному исследователю. Только рандомизация пациентов при включении их в проспективное исследование позволяет сделать сравниваемые группы сопоставимыми по всем, в том числе неизвестным признакам.

До той поры, пока исследователь не может создать для своего собственного исследования с одинаковые (в пределах случайных колебаний!) группы помощью рандомизации, и в тех случаях, когда проведение проспективного исследования невозможно, что нередко имеет место, например, у медицинских аспирантов, которые стеснены как во времени, так и в средствах, у исследователя остаются возможности наличными средствами сравнивать группы и изучать величину возможного смещения в результате неравенства групп.

6. Методы контроля над систематическими ошибками

Стандартизация - наиболее известный и достаточно эффективный способ внесения поправок на величину отдельного признака. Самый распространенный вид применения стандартизации - по возрасту. Можно, однако, стандартизовать, например, сравниваемые стационары по структуре коек и так далее. Недостатком прямой и непрямой стандартизации является ограниченная возможность использования одновременно нескольких признаков. Например, если известно, что сравниваемые группы различаются одновременно по полу, возрасту и тяжести болезни, то весьма соблазнительно вычислительными средствами внести поправки на эти признаки и оценить, какова же разница в исходах при устранении влияния этих признаков. Этим целям служит ряд методов, основанных на регрессионном анализе. Подчеркнём, что при внесении поправок на несколько признаков одновременно, в особенности при изучении небольших групп пациентов, легко возникают ситуации «перепоправки» и ложные результаты, не всегда очевидные. Кроме того, внесение поправок на известные различия между группами не исключает действия возможных неизвестных различий. Поэтому сравнение изучаемых групп по ряду доступных признаков - обязательная процедура для выявления возможных различий между группами, т.е. признаков СО отбора, но внесение поправок на обнаруженные различия не исключает наличия других существенных различий.

Тем не менее, анализ серий случаев из практики имеет право на существование применительно к получению предварительных результатов, в особенности в тех областях, где проведение контролируемого эксперимента затруднено. Еще одним вариантом сравнения серий случаев или групп проспективного исследования, составленных без использования правильной рандомизации и ослепления является стратификационный анализ. Это - принципиально простая процедура, но очень полезная тем, что помогает исследователю лучше «увидеть и почувствовать» полученные данные. Она состоит в стратификации (разделении на страты - слои, группы) полученных данных. Например, в случае сравнения результатов лечения с использованием двух разновидностей оперативного вмешательства, длительное время сосуществующих в практике, такими стратами могут быть больны, оперированные в последние пять лет и по отдельности в предшествующие пятилетия. При таком сравнении может выясниться, например, что лучшие результаты у метода А обнаруживаются потому, что в течение 15 лет исходы при данном заболевании улучшаются (по каким-то причинам), и одновременно метод Б применяется реже; может быть видно, что для больных, оперированных в одно время, результаты двух методов лечения не различаются существенно.

Литература

1 A dictionary of epidemiology. 4 edn. IEA, Oxford University Press: Oxford, 2001:196.

2 Sackett DL, Oxman AD. HARLOT plc: an amalgamation of the world"s two oldest professions. Brit Med J 2003;327(7429):1442-1445.

3 Kolstad HA, Olsen J. Why Do Short Term Workers Have High Mortality? Am J Epidemiol -352.

4 Власов ВВ. Явления непреднамеренного отбора в клинических исследованиях. Клинич мед

5 Coughlin SS. Recall bias in epidemiologic studies. J Clin Epid 1990;43(1):87-91.

6 Hosek RS, Flanders WD, Sasco AJ. Bias in case-control studies of screening effectiveness. Am J Epidemiol 1996;143(2):193-201.

7 Grimes DA, Schulz KF. Bias and causal associations in observational research. L 2002;359:248-252.

8 Lachs MS, Nachamkin I, Edelstein PH et al. Spectrum bias in the evaluation of diagnostic tests: Lessons from the rapid dipstick test for urinary tract infection. Ann Intern Med 1992;117.- # 2:135-140.

9 Dickersin K, Min Y-I. Publication bias: The problem that won"t go away. Ann N Y Acad Sci 1993;703:135-148.

10 Berlin JA, Begg CB, Louis TA. An assessment of publication bias using a sample of published clinical trials. J Amer Statist Assoc 1989;84:381-392.

Размещено на Allbest.ru

...

Подобные документы

    Сущность понятий выборки и выборочного наблюдения, основные виды и категории отбора. Определение объема и численности выборки. Практическое применение статистического анализа выборочного наблюдения. Расчет ошибок выборочной доли и выборочной средней.

    курсовая работа , добавлен 17.02.2015

    Классификация ошибок наблюдения в зависимости от причин возникновения. Особенности ошибок регистрации и репрезентативности. Преимущества выборочного наблюдения перед сплошным. Допустимый уровень ошибки. Понятие ряда динамики в статистической науке.

    контрольная работа , добавлен 22.06.2015

    Понятие выборочного наблюдения. Определение объема и численности выборки. Практическое применение в статистическом анализе выборочного наблюдения. Формулы предельных ошибок выборочной доли и среднего показателя. Значения гарантийного коэффициента.

    курсовая работа , добавлен 11.02.2015

    Схема собственно-случайной бесповторной выборки. Определение средней ошибки выборки для среднего значения, среднего квадратического отклонения и предельной ошибки выборки. Определение эмпирического распределения. Расчетное значение критерия Пирсона.

    контрольная работа , добавлен 05.03.2012

    История происхождения статистики как научной дисциплины. Сущности и свойства статистической совокупности. Понятие, формы организации, виды и документальное сопровождение статистического наблюдения. Описание ошибок регистрации и репрезентативности.

    реферат , добавлен 13.11.2010

    Понятие о выборочном методе наблюдения, его цель и основные статистические показатели. Способы отбора в выборочную совокупность. Определение средних и предельных ошибок, возникающих при исследовании. Определение необходимости численности выборки.

    презентация , добавлен 25.05.2016

    Сущность несплошного наблюдения в математической статистике, предоставление формул определения его средней и предельной ошибок. Содержание и параметры механического, типического и серийного видов отбора элементов совокупности выборочного обследования.

    курсовая работа , добавлен 15.01.2011

    Изучение выполнения плана. Десятипроцентное выборочное обследование по методу случайного бесповторного отбора. Себестоимость продукции завода. Предельная ошибка выборки. Динамика средних цен и объема продажи продукта. Индекс цен переменного состава.

    контрольная работа , добавлен 09.02.2009

    Дескриптивная статистика и статистический вывод. Способы отбора, обеспечивающие репрезентативность выборки. Влияние вида выборки на величину ошибки. Задачи при применении выборочного метода. Распространение данных наблюдения на генеральную совокупность.

    контрольная работа , добавлен 27.02.2011

    Теоретическая основа выборочного метода математической статистики, его роль в экономике. Описание характера ошибок регистрации и репрезентативности. Приведение формул расчета финансовых, производственных и трудовых показателей деятельности предприятия.

Ошибки измерения делятся на случайные (тот самый шум, о котором шла речь ранее) и систематические. Прояснить, что такое систематическая ошиб­ка, можно на следующем примере: предположим, мы немного изменим в схеме по рис. 13.3 сопротивление резистора R2. При этом у нас на опреде­ленную величину сдвинется вся шкала измерений: показания термометра бу­дут соответствовать действительности, только если мы прибавим (или вы­чтем, неважно) некоторую константу к полученной величине: / = /’ + 5, где / - «правильное» значение температуры (оно все же отличается от истинно­го значения из-за наличия случайной ошибки); /’ - показания термометра; 5 - величина систематической ошибки из-за сдвига шкалы. Более сложный случай систематической погрешности - если мы оставим R2 в покое, а не­много изменим R5, то есть изменим наклон характеристики термометра, или, как еще это называют, крутизну преобразования. Это равносильно тому, что мы умножаем показания на некий постоянный множитель к, и «правильное» значение будет тогда определяться по формуле: t = ht\ Эти виды ошибок но­сят название аддитивной и мультипликативной погрешностей.

О систематических погрешностях математическая статистика «ничего не зна­ет», она работает только с погрешностями случайными. Единственный спо­соб избавиться от систематических погрешностей (кроме, конечно, подбора прецизионных компонентов) - это процедуры калибровки (градуировки), о них мы уже говорили в этой главе ранее.

Случайные ошибки измерения и их оценка

я предполагаю, что читатель знаком с таким понятием, как вероятность. Ес­ли же нет - настоятельно рекомендую книгу , которая есть переиздание труда от 1946 г. Расширить кругозор вам поможет классический учебник , который отличает исключительная внятность изложения (автор его, извест­ный математик Елена Сергеевна Вентцель, кроме научной и преподаватель­ской деятельности, также писала художественную литературу под псевдони­мом И. Грекова). Более конкретные сведения о приложении методов математической статистики к задачам метрологии и обработки эксперимен­тальных данных, в том числе с использованием компьютера, вы можете най­ти, например, в . Мы же остановимся на главном - расчете случайной по­грешности.

В основе математической статистики лежит понятие о нормальном распре­делении. Не следует думать, что это нечто заумное - вся теория вероятно­стей и матстатистика, как прикладная дисциплина, в особенности, основа­ны на здравом смысле в большей степени, чем какой-либо другой раздел математики.

Не составляет исключения и нормальный закон распределения, который на­глядно можно пояснить так. Представьте себе, что вы ждете автобус на оста­новке. Предположим, что автопарк работает честно, и надпись на табличке «интервал 15 мин» соответствует действительности. Пусть также известно, что предыдущий автобус отправился от остановки ровно в 10:00. Вопрос - во сколько отправится следующий?

Как бы идеально ни работал автопарк, совершенно ясно, что ровно в 10:15 следующий автобус отправится вряд ли. Пусть даже автобус выехал из парка по графику, но тут же был вынужден его нарушить из-за аварии на перекре­стке. Потом его задержал перебегающий дорогу школьник. Потом он просто­ял на остановке из-за старушки с огромной клетчатой сумкой, которая за­стряла в дверях. Означает ли это, что автобус всегда только опаздывает? От­нюдь, у водителя есть план, и он заинтересован в том, чтобы двигаться побы­стрее, потому он может кое-где и опережать график, не гнушаясь иногда и нарушением правил движения. Поэтому событие, заключающееся в том, что автобус отправится в 10.15, имеет лишь определенную вероятность, не более.

Если поразмыслить, то станет ясно, что вероятность того, что следующий автобус отправится от остановки в определенный момент, зависит также от того, насколько точно мы определяем этот момент. Ясно, что вероятность отправления в промежутке от 10.10 до 10.20 гораздо выше, чем в промежутке от 10.14 до 10.16, а в промежутке от 10 до 11 часов оно, если не возникли ка­кие-то форс-мажорные обстоятельства, скорее всего, произойдет наверняка. Чем точнее мы определяем момент события, тем меньше вероятность того, что оно произойдет именно в этот момент, и в пределе вероятность того, что любое событие произойдет ровно в указанный момент времени, равна нулю.

Такое кажущееся противоречие (на которое, между прочим, обращал внима­ние еще великий отечественный математик Колмогоров) на практике разре­шается стандартным для математики способом: мы принимаем за момент события некий малый интервал времени 5/. Вероятность того, что событие произойдет в этом интервале, уже равна не нулю, а некоей конечной величи­не бЛ а их отношение 5P/5t при устремлении интервала времени к нулю рав­на для данного момента времени некоей величине /?, именуемой плотностью распределения вероятностей. Такое определение совершенно аналогично определению плотности физического тела (в самом деле, масса исчезающе малого объема тела также стремится к нулю, но отношение массы к объему конечно) и потому многие понятия математической статистики имеют назва­ния, заимствованные из соответствующих разделов физики.

Правильно сформулированный вопрос по поводу автобуса звучал бы так: ка­ково распределение плотности вероятностей отправления автобуса во време­ни? Зная эту закономерность, мы можем всегда сказать, какова вероятность того, что автобус отправится в определенный промежуток времени.

Интуитивно форму кривой распределения плотности вероятностей опреде­лить несложно. Существует ли вероятность того, что конкретный автобус отправится, к примеру, позже 10:30 или, наоборот, даже раньше предыдуще­го автобуса? А почему нет - подобные ситуации в реальности представить себе очень легко. Однако ясно, что такая вероятность намного меньше, чем вероятность прихода «около 10:15». Чем дальше в обе стороны мы удаляемся от этого центрального наиболее вероятного срока, тем меньше плотность ве­роятности, пока она не станет практически равной нулю (то, что автобус за­держится на сутки - событие невероятное, скорее всего, если такое случи­лось, вам уже будет не до автобусов). То есть распределение плотностей ве­роятностей должно иметь вид некоей колоколообразной кривой.

В теории вероятностей доказывается, что при некоторых предположениях относительно вероятности конкретных исходов нашего события, эта кривая будет иметь совершенно определенный вид, который называется нормаль­ным распределением вероятностей или распределением Гаусса. Вид кривой плотности нормального распределения и соответствующая формула показа­ны на рис. 13.5.

Рис. 13.5. Плотность нормального распределения вероятностей

Далее мы поясним смысл отдельных параметров в этой формуле, а пока отве­тим на вопрос: действительно ли реальные события, в частности, интере­сующие нас ошибки измерения, всегда имеют нормальное распределение? Строгого ответа на этот вопрос в общем случае нет, и вот по какой причине. Математики имеют дело с абстракциями, считая, что мы уже имеем сколь угодно большой набор отдельных реализаций события (в случае с автобусом это была бы бесконечная таблица пар значений «плотность вероятности - время»). В реальной жизни такой ряд невозможно получить не только пото­му, что для этого потребовалось бы бесконечно долго стоять около остановки и отмечать моменты отправления, но и потому, что стройная картина непре­рывного ряда реализаций одного события (прихода конкретного автобуса) будет в конце концов нарушена совершенно не относящимися к делу веща­ми: маршрут могут отменить, остановку перепестри, автопарк обанкротится, не выдержав конкуренции с маршрутными такси… да мало ли что может произойти такого, что сделает бессмысленным само определение события.

Однако все же интуитивно понятно, что, пока автобус ходит, какое-то, пусть теоретическое, распределение имеется. Такой идеальный бесконеч­ный набор реализаций данного события носит название генеральной сово­купности. Именно генеральная совокупность при некоторых условиях мо­жет иметь, в частности, нормальное распределение. В реальности же мы имеем дело с выборкой из этой генеральной совокупности. Причем одна из важнейших задач, решаемых в математической статистике, состоит в том, чтобы имея на руках две разных выборки, доказать, что они принадлежат одной и той же генеральной совокупности - проще говоря, что перед нами есть реализации одного и того же события. Другая важнейшая для практи­ки задача состоит в том, чтобы по выборке определить вид кривой распре­деления и ее параметры.

На свете сколько угодно случайных событий и процессов, имеющих распре­деление, совершенно отличное от нормального, однако считается (и доказы­вается с помощью т. н. центральной предельной теоремы), что в интересую­щей нас области ошибок измерений при большом числе измерений и истинно случайном их характере, все распределения ошибок - нормальные. Предпо­ложение о большом числе измерений не слишком жесткое - реально доста­точно полутора-двух дес5Гтков измерений, чтобы все теоретические соотно­шения с большой степенью точности соблюдались на практике. А вот про истинную случайность ошибки каждого из измерений можно говорить с из­рядной долей условности: неслучайными их может сделать одно только же­лание экспериментатора побыстрее закончить рабочий день. Но математика тут уже бессильна.

Полученные опытным путем характеристики распределения называются оценками параметров, и, естественно, они будут соответствовать «настоя­щим» значениям с некоторой долей вероятности - наша задача и состоит в том, чтобы определить интервал, в котором могут находиться отклонения оценок от «истинного» значения и соответствующую ему вероятность. Но настало время все же пояснить - что же это за параметры?

в формуле на рис. 13.5 таких параметра два- величины ц и а. Они называ­ется моментами нормального распределения (аналогично моментам распре­деления масс в механике). Параметр ц называется математическим ожидани­ем (или моментом распределения первого порядка), а величина а - средним квадратическим отклонением. Нередко употребляют его квадрат, обозначае­мый как D или просто и носящий название дисперсии (или центрального момента второго порядка).

Математическое ожидание есть абсцисса максимума кривой нормального распределения (в нашем примере с автобусом это время 10:15), а дисперсия, как видно из рис. 13.5, характеризует «размытие» кривой относительно этого максимума- чем больше дисперсия, тем положе кривая. Этим моменты имеют прозрачный физический смысл (вспомните аналогию с фи^зическим распределением плотностей): математическое ожидание есть аналогия цен­тра масс некоего тела, а дисперсия характеризует распределение масс отно­сительно этого центра (хотя распределение плотности материи в физическом теле далеко от нормального распределения плотности вероятности).

Оценкой гпх математического ожидания ц служит хорошо знакомое нам со школы среднее арифметическое:

Здесь п- число измерений; /- текущий номер измерения (/= l,…,w); дс/ - значение измеряемой величины в /-м случае.

Оценка дисперсии вычисляется по формуле:

(2)

Оценка среднего квадратического отклонения, соответственно, будет:

Здесь (jc, – гПх) - отклонения конкретных измерений от ранее вычисленного среднего.

Следует особо обратить внимание, что сумму квадратов отклонений делить следует именно на « – 1, а не на «, как может показаться на первый взгляд, иначе оценка получится смещенной. Второе, на что следует обратить внима­ние - разброс относительно среднего характеризует именно среднее квадра-тическое отклонение, вычисленное по формулам (2) и (3), а не среднее арифметическое отклонение, как рекомендуют в некоторых школьных справочни­ках - последнее дает заниженную и смещенную оценку (не напоминает ли вам это аналогию со средним арифметическим и действующим значениями переменного напряжения?).

Заметки на полях

Кроме математического ожидания, средние значения распределения вероят­ностей характеризуют еще величинами, называемыми модой и медианой. В случае нормального распределения все три величины совпадают, но в дру­гих случаях они могут оказаться полезными: мода есть абсцисса наивероят-нейшего значения (то есть максимума на кривой распределения, что полно­стью отвечает бытовому понятию о моде), а медиана выборки есть такая точка, что половина выборки лежит левее ее, а вторая половина - правее.

В принципе этими формулами для расчета случайных погрешностей можно было бы ограничиться, если бы не один важный вопрос: оценки-то мы полу­чили, а вот в какой степени они отвечают действительности? Правильно сформулированный вопрос будет звучать так: какова вероятность того, что среднее арифметическое отклоняется от «истинного» значения (то есть мате­матического ожидания) не более чем на некоторою величину 8 (например, на величину оценки среднего квадратического отклонения s)?

Величина 5 носит название доверительного интервала, а соответствующая вероятность - доверительной вероятностью (или надежностью). Обычно решают задачу, противоположную сформулированной: задаются величиной надежности и вычисляют доверительный интервал 5. В технике принято за­даваться величиной надежности 95%, в очень уж серьезных случаях - 99%. Простейшее правило для обычных измерений в этом случае таково: при уело-вии достаточно большого числа измерений (практически - более 15-20) доверительной вероятности в 95% соответствует доверительный интер­вал в 2Sy а доверительной вероятности в 99% - доверительный интервал в 3s. Это известное правило «трех сигма», согласно которому за пределы утро­енного квадратического отклонения не выйдет ни один результат измерения, но на практике это слишком жесткое требование. Если мы не поленимся про­вести не менее полутора десятков отдельных измерений величины дс, то с чистой совестью можем записать, что результат будет равен