ЭКОЛОГИЧЕСКАЯ ТОКСИКОЛОГИЯ

К ПРОБЛЕМЕ УСТАНОВЛЕНИЯ БЕЗОПАСНЫХ УРОВНЕЙ ТОКСИЧЕСКИХ ВЕЩЕСТВ ВО ВНЕШНЕЙ СРЕДЕ

И.Д. Ташкер, к.м.н.

Институт медицины труда АМН Украины, г. Киев

Первая же статья журнала "Современные проблемы токсикологии" (№1, 1998) выделила как приоритетные проблемы биомониторинга ксенобиотиков задачи пересмотра действующих и установления новых безопасных уровней содержания вредных веществ во внешней среде. При этом И.М. Трахтенберг [19] отметил наличие заметных разночтений в терминологии и интерпретации ряда определений, подчеркнул необходимость учета специфики и целей исследования при использовании математической статистики. Вновь подтверждается актуальность высказывания Дж. Гласса и Дж. Стенли [1]: "Математика может избавить от мучительной необходимости размышлять, но за эту привилегию мы должны платить муками раздумий как до, так и после введения математики в действие".

В настоящей работе рассматриваются существенные разночтения и ошибки при регламентации уровней допустимого содержания во внешней среде токсических веществ с применением статистических методов. На основе проведенного анализа предлагаются пути согласования соответствующих нормативов в разных странах. Обсуждение учитывает концепцию В.В. Налимова [10] о вероятностной модели языка, многозначности и метафоричности терминов, языке математической статистики как метаязыке экспериментальных наук, возможной математизации не только знаний, но и нелепостей; о моделях, логика которых не подчиняется закону исключения третьего, а придает различным высказываниям разный вес.

Статистический анализ позволяет с известной степенью надежности судить о всей совокупности объектов на основании исследования малых выборок. Классические методы используют законы распределения случайных величин (есть и свободные от этих законов процедуры). Так, t-распределение Стьюдента характеризует вероятность возможных отклонений (М±m) выборочной средней величины M от оцениваемого ею значения параметра m. Большим отклонениям, которые при изучении многих выборок встречаются редко, соответствуют большие величины t и малые вероятности aэ. Доверительный интервал, построенный с использованием высокого значения t, вокруг эмпирической точечной оценки параметра Мэ будет включать истинную величину m в 100(1-a) % случаев или с надежностью 1-a. С другой стороны, когда величина m известна, по t-распределению можно узнать вероятность aэ случайного извлечения выборок, дающих эмпирическую оценку Мэ. По aэ косвенно судят, насколько вероятна принадлежность анализируемой выборки и представляемых ею объектов к множеству, характеризуемому параметром m. Нулевую гипотезу H0: m1-m0=0 о равенстве параметров теоретической (m0) и изучаемой (m1) совокупностей отклоняют, как маловероятную, на уровне значимости aкр, если aэ< aкр, т. е. когда, при справедливости H0, вероятность получения Мэ будет ниже выбранной заранее малой величины aкр. Если же вероятность случайного получения Мэ окажется выше критического уровня (aэ> aкр) — гипотезу не отклоняют. Ее принимают, но не считают доказанной, поскольку тем же данным могут отвечать иные гипотезы. Здесь aкр выражает вероятность ошибочного отклонения истинной нулевой гипотезы (риск 1-го рода), но величина 1-aкр не характеризует надежность принятой гипотезы. Принятие нулевой гипотезы может быть ошибочным, когда параметры изучаемой и теоретической совокупностей в действительности не равны. Вероятность совершения такой ошибки (риск 2-го рода) b можно определить по разности параметров, указываемой в альтернативных гипотезах вида H1: m1-m0=D1.

Первоначально развитие методов статистического анализа выборок стимулировали запросы промышленности и сельского хозяйства [13]. Это определило традицию проверять в качестве основной или единственной гипотезу об отсутствии изменений при фиксированных критических уровнях значимости. Если нулевую гипотезу не отклонили — налаженный производственный процесс продолжают, если отклонили — его корректируют. Для существенных изменений процесса допустим риск напрасного вмешательства 5 % (доверительный интервал вокруг m0 или D=0 (ДИ) с надежностью 95 %). В ответственных случаях, связанных с большими затратами, уровень риска 1-го рода снижают до 1 % или 0,1 % (увеличивают ДИ до надежности 99 % или 99,9%). Но чтобы насторожиться, вовремя провести дополнительные исследования и некоторые перемены, риск ложной тревоги целесообразно увеличить до 10 % (сократить ДИ до надежности 90 %). Со временем были расширены возможности и сферы применения математической статистики, показано преимущество в ряде случаев других математических подходов [21]. Статистическим методам, эффективным при мониторинге окружающей среды, посвящена книга [2] и добавленная редактором ее перевода обширная библиография. Но разработка и освоение этих методов идут не просто [16].

Публикации отечественных исследователей по установлению предельно допустимых концентраций (ПДК) вредных веществ и контролю с помощью математической статистики позволяют выделить пять основных типов методологических ошибок (м.ош.).
1. Смешение двух видов анализа выборок — оценивания параметеров генеральной совокупности и проверки гипотез [1—4]. В результате гипотезу, не отклоненную на уровне значимости a %, необоснованно признают "достоверной" на 100-a %, т. е. якобы доказанной с вероятностью охвата оцениваемой величины параметра доверительным интервалом.
2. Неправильный выбор основной гипотезы.
3. Неправильный выбор критического уровня значимости вследствие игнорирования специфики гигиенических задач. Традиционно без учета альтернатив рассматривают лишь гипотезу об отсутствии различий с контролем при aкр <= 5 %.
4. Перенос на анализируемую выборку свойств генеральной совокупности и, как следствие, завышение прогностической ценности полученных оценок.
5. Недостаточная дифференциация используемых в анализе видов вероятности. В частности, такая ошибка в сочетании с м.ош. 1 ведет к преувеличению силы взаимосвязи, якобы определяющей 95 % вариабельности переменных при любом коэффициенте корреляции, который отличен от нуля на уровне значимости 5 %.

Обсудим проявление перечисленных ошибок в часто цитируемых алгоритмах определения ПДК токсических веществ с использованием статистических критериев.

В одной из своих публикаций Ю.С. Каган [5], следуя рекомендации Н.А. Плохинского применять три степени вероятности "безошибочного суждения" 0,954, 0,987 и 0,997, предложил использовать третью степень при экспериментальном выявлении вредного влияния веществ, а в таких ответственных ситуациях, как определение канцерогенного эффекта, — более высокую степень 0,999936, при которой вероятность ошибки составит 0,000064 или 1 случай на 15625. Эти степени вероятности соответствуют надежности доверительных интервалов средней, рассчитанных с множителями 2; 2,5; 3 и 4 для идеального нормального распределения. В той же статье дана таблица вероятностной оценки пороговых и неэффективных доз: при возникновении эффекта в 99,7 % (частоте отсутствия эффекта 0,3 %) доза оценивается как "возникновение порога эффекта с вероятностью 0,95"; при частоте возникновения 95—50 % (частоте отсутствия 5—50 %) - как "порог с вероятностью" 0,95—0,5; при частоте возникновения 32-0,3 % (частоте отсутствия эффекта 68—99,7 %) — как "неэффективная доза с вероятностью" 0,68-0,997.

Примечательно, что доза еще признается пороговой при частоте возникновения эффекта 50 %, а при 32 % — уже неэффективной. Учитывая случайный характер эмпирических оценок, придется допустить более частое возникновение эффекта при пороговых и неэффективных, согласно таблице, дозах. Использование математической статистики, раскрывая метафоричность терминов вроде "пороговая и неэффективная" доза, "безошибочный" (но с вероятностью ошибки) прогноз, позволяет лучше понять достоинства и недостатки, явные и скрытые противоречия предлагаемых подходов. В статье [5] противоречие между высокой частотой (до 1/2 и 1/3) возникновения эффекта при "неэффективных и пороговых" дозах и мизерной вероятностью (1/15625) ошибки при выявлении канцерогенного действия можно объяснить использованием различных вероятностных шкал для разных по природе откликов — частоты возникновения эффекта и характеризующих эффект показателей организма. По-видимому, несоответствие шкал вызвано сложностями практического определения вероятностных характеристик, особенно низких частот возникновения эффекта. Критические уровни шкал формально зависят от биологической значимости откликов: чем она выше, тем ниже допустимые частота возникновения эффекта и вероятность ошибки. Однако специфических ошибок проверки гипотез статья, как и учебник Н.А. Плохинского, не обсуждает. Расширяя же доверительный интервал при оценке канцерогенного эффекта, автор снижает лишь риск 1-го рода для проверки нулевой гипотезы, ошибку гипердиагностики, забыв о попутном увеличении ошибки гиподиагностики.

Представленные в статье [5] два стремления (иметь выраженный эффект; для умньшения ошибки использовать больший охват величин, характеризующих норму) объединил И.В. Саноцкий, предложив относить к порогу вредного действия изменения не только статистически значимые (a <= 5 %), но и выходящие за пределы нормы или физиологических колебаний (±2s) показателя [15]. Позднее [14] он обосновывал расширение границ нормы до ±3s: "в экспериментальной проработке профилактических мероприятий обычно закладывается достоверность выводов, равная 95 % (~ ±2s). Это значит, что рекомендуемый санитарный стандарт, ограничивающий загрязнение, рассчитан не на всю популяцию. 5 % особей в условиях соблюдения ПДК могут оказаться пораженными (в генетике обычно закладывается вероятноссть 99 % (±3s)". То есть, схема И.В. Саноцкого ориентирована на то, чтобы при пороговой дозе, во-первых, неблагоприятные изменения отсутствовали у 95 % популяции и, во-вторых, за пределом нормы находилось не менее половины подвергнутых экспериментальному воздействию организмов. Для защиты не 95, а 99 % популяции автор предлагает расширить диапазон биологической нормы в полтора раза. Но охват большей доли "нормальной" популяции, как и увеличение доверительных интервалов, ведет к росту ошибки гиподиагностики, поскольку больше приграничных нормальных величин будет обнаружено у пораженных особей.

Даже не оцененная количественно вероятность гиподиагностики в ряде случаев применения схемы И.В. Саноцкого была признана неприемлемо большой. Чтобы преодолеть этот недостаток И.М. Трахтенберг и соавторы [19, 20] предложили при оценке вызванных в организме изменений выбирать критические уровни значимости aкр (р) с учетом цели и ответственности исследования, специфичности показателей к изучаемому воздействию, степени их вариабельности. Рекомендовано повысить aкр с 5 до 10 % для более специфичных показателей, и принять его равным 10, 5 и 1 % соответственно для жестких, пластичных и высокопластичных показателей.

Соглашаясь с основной идеей и общим обоснованием такого подхода, отметим необходимость некоторых коррективов.

Разделять показатели на жесткие и пластичные предложено по величине коэффициента вариации — соотношению стандартного отклонения и арифметической средней [20]. В то же не время следует учитывать, что средние величины даже родственных показателей могут различаться намного сильнее, чем вариация вокруг них. Так, средняя концентрация натрия в плазме превышает концентрацию в эритроцитах в 10 раз, а ошибка средней — только в 2 раза. Поэтому, с нашей точки зрения, рациональной представляется классификация вариабельности показателей вне зависимости от средних значений, например, по соотношению дисперсий, характеризующих изменчивость у отдельных индивидуумов и между ними [17]. Такой критерий концептуально близок к предложенной в свое время В. Лексисом [13] мере устойчивости статистических рядов.

Обосновывая целесообразность увеличения уровня значимости aкр для снижения гиподиагностики, авторы [20] одновременно обсуждают доверительную вероятность 1-aкр. Это допустимо, поскольку они рассматривают только нулевую гипотезу сравнения с контролем (альтернативой служит не иная гипотеза, а другое решение при проверке гипотезы). Но авторы говорят о подтверждении и достоверности гипотез на 60, 90, 99 %, рассматривают уровень значимости как характеристику дозы, а не заранее выбранный критерий вероятности правильного или ошибочного отклонения основной гипотезы. Следуя традиции, И.М. Трахтенберг [19] предложил уровень значимости 1 % при выяснении потенциальной опасности промышленных веществ, подозрительных на канцерогенность или мутагенность.

Последствия подобных предложений демонстрирует проведенный ранее анализ показательного радиационного контроля [18]. В районе захоронения радиационных отходов активность сточных вод возросла на 36 %. Величина t-критерия 2,1 позволяла отклонить нулевую гипотезу на уровне значимости 5 %, а при одностороннем тесте (поскольку отходы могут вызывать только повышение радиации) — на уровне 2 %. Но ввиду высокой опасности воздействия по традиции был выбран критический уровнь значимости 1 % (t=2,62). Отклонив гипотезу, исследователи заключили, что "можно с надежностью 99 % считать расхождение незначимым и нет необходимости проводить дополнительный контроль с целью выяснения причин увеличения активности стоков". Объективно такой подход призывает беспокоиться о вредных последствиях лишь при вероятности риска ложной тревоги ниже 1 %. Учитывая задачи санитарного контроля за высокоопасными воздействиями, представляется оправданным использовать в качестве критического t=1 (aкр <= 15 %), когда вероятность гипердиагностики не превысит 15 % [18].

Примечательно, что Н.А. Плохинский в своем последнем руководстве [12] уже рекомендовал "обратный порядок порогов вероятности", т. е. уменьшение доверительных интервалов и увеличение уровня a при более ответственном сравнении эмпирического и теоретического распределений, в отличие от сравнения двух эмпирических распределений.

Вопрос гарантии безопасности 95 или 99 % популяции имеет самостоятельное значение. С ним связано и понятие максимально допустимого риска, который, например, для экосистемы равен вероятности гибели 5 % видов, составляющих биоценоз [25].

Поскольку эмпирические оценки М и s (параметров m и s) являются случайными величинами, интервал М±2s включает в среднем не 95 %, а 80—90 % генеральной совокупности. Чтобы с известной степенью надежности g обеспечить охват заданной доли P совокупности, рассчитывают толерантные или допустимые интервалы с помощью более высоких коэффициентов k [3, 4, 11]. Так, если параметры М и s оценены по 20 наблюдениям, для гарантии охвата 95 % генеральной совокупности с надежностью 95 или 99 % коэффициенты k должны равняться 2,75 или 3,17. В.Г. Ковязин [8] предложил использовать толерантные интервалы для характеристики физиологических колебаний показателей организма при определении порога вредного действия. В дальнейшем [9] он признал, что последовательная реализация этого предложения без сопутствующих изменений привела бы к нежелательному "перевороту" в нормировании вредных веществ. Но вопреки такому предостережению появились публикации, в которых уровни, по схеме И.В. Саноцкого признанные неблагоприятными, после применения толерантных интервалов были рекомендованы как безопасные и допустимые [6, 7]. И вновь не было учтено резкое увеличение риска гиподиагностики.

Как писал Р. Фишер [22], "основная гипотеза не может быть доказана в ходе эксперимента, ее, быть может, удастся лишь опровергнуть. ...Всякий эксперимент может быть назван таковым лишь постольку, поскольку он дает возможность опровергнуть основную гипотезу". Очевидно, традиционная процедура проверки одной статистической гипотезы будет соответствовать задачам гигиенического нормирования, если исследовать в качестве основного, отклоняемого экспериментом, предположение о наличии, а не отсутствии негативных изменений. В этом случае уровень значимости a выразит вероятность ошибочной гиподиагностики. Толерантные интервалы будут надежно гарантировать охват 95; 99 и 99,9 % негативно меняющейся совокупности, а вне интервалов риск неблагоприятного воздействия окажется ниже заданных уровней 5; 1 или 0,1 %. По-видимому, именно границы толерантных интервалов целесообразно признавать пороговыми и предельно допустимыми уровнями.

Статистические процедуры оценивания параметров, проверки гипотез, определения толерантных интервалов применимы к статистически устойчивым случайным величинам, измеряемым непосредственно или путем дополнительных рассчетов, характеризующим как воздействующие факторы (x), так и эффекты воздействия или отклики (y). Для корректного получения статистических оценок или теоретических значений параметров требуется правильное формирование исследуемых выборок из достаточно очерченных совокупностей с учетом объекта и цели исследования.

Цели установления допустимых уровней содержания вредных веществ и его методы исторически менялись от профилактики летальных исходов к предупреждению заболеваний, а затем — признаков ухудшения здоровья и функционирования организма. Но, если принятые государствами допустимые величины воздействия зависят от уровня социально-экономического развития, то представления о степени вредности или опасности для организма конкретных воздействий, очевидно, должны быть свободны от этих обстоятельств.

Общую зависимость величины отклика от уровней воздействия характеризует S-образная кривая, точки перелома которой указывают на резкие качественные изменения, а линейный участок — описывает нормальное функционирование регуляторных систем. В разных диапазонах варьирования фактора информативны различные показатели. Набором кривых, представляющих разные уровни жизнедеятельности, можно составить сводную S-образную кривую зависимости доза-эффект, вершина которой соответствует смерти. На этой кривой Т. Хэтч [23] выделил 3 точки, соответствующие начальному проявлению диагноза заболевания (А), минимальному физиологическому нарушению, которое предшествует заболеванию (В), максимальным уровням воздействия, при которых реакции не отклоняются от нормы (С). Допустимые уровни воздействия, по мнению Т. Хэтча, устанавливали в бывшем СССР по точке С (начальные отклонения от нормы), а в США — по точке В (начальные проявления патологии). Но, как было показано выше, практика нормирования в бывшем СССР, по крайней мере на первом этапе разработок, объективно была направлена на определение выраженных, а не начальных изменений. Все внимание уделялось снижению риска гипердиагностики, хотя субъективно преследовалась цель сохранить как можно большую часть нормальной и здоровой популяции.

Кривые Хэтча и аналогичные графики других авторов позволяют обобщить большой материал в виде математических моделей, в которых состояния организма и уровни воздействия факторов будут фиксированы или охаратеризованы точечными и интервальными оценками. Дифференциация смежных областей окажется тем точнее, чем большей будет разность между центральными значениями дифференцируемых градаций D=m1 - m2. Величины параметров могут быть ориентированы на конкретные популяции или на условный организм, как в справочнике [24]. Последний способ особенно полезен для выражения разности близких состояний, четко определяемой лишь в лабораторных условиях. Тем более, что при сравнении совокупностей параметр D может быть единственным в формулировке статистической гипотезы.

В целях профилактической токсикологии предпочтительно в качестве основной проверять гипотезу о неблагоприятном состоянии организма при изучаемых воздействиях, стремясь в первую очередь уменьшить ошибку гиподиагностики. Этому больше отвечают критерии, согласно Т. Хэтчу, используемые в США, но в действительности применявшиеся и в бывшем СССР. Причина расхождений принятых в разных странах ПДК токсических веществ, по-видимому, не исчерпывается различиями биологических критериев. Преодолению концептуальных разногласий между специалистами будут способствовать согласованные разработки исследователей, предупреждение методологических ошибок в применении математической статистики, тестирование нескольких гипотез с оценкой риска гипер- и гиподиагностики предполагаемых изменений. Особое внимание следует уделять определению значений параметров, которые характеризуют негативные изменения и могут использоваться при формулировке альтернативных гипотез.

ЛИТЕРАТУРА
1. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. —М.: Прогресс, 1976. —496 с.
2. Дерффель К. Статистика в аналитической химии // Пер. с нем. под ред. Ю.П. Адлера. —М.: Мир, 1994. —268 с.
3. Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке: Методы обработки данных. —М.: Мир, 1980. —612 с.
4. Закс Л. Статистическое оценивание. —М.: Статистика, 1976. —598 с.
5. Каган Ю.С. О вероятностном подходе к установлению пороговых и неэффективных доз при действии химических веществ // Гигиена и санитария. —1978, N 8. —С. 278.
6. Ковалев А.Ф. // Гигиена и санитария. —1990, N 8. —С. 85-86.
7. Ковалев А.Ф. // Там же. —1991, N 5. —С. 27-30.
8. Ковязин В.Г. // Гигиена и санитария. —1978, N 12. —С. 78-80.
9. Ковязин В.Г. // Там же. —1987, N 12. —С. 59.
10. Налимов В.В. Вероятностная модель языка. —М.: Наука, 1979. —303 с.
11. Оуэн Д.Б. Сборник статистических таблиц. —М.: ВЦ АН СССР, 1966. —586 с.
12. Плохинский Н.А. Алгоритмы биометрии. —М.: Изд-во МГУ, 1980. —150 с.
13. Плошко Б.Г., Елисеева И.И. История статистики. —М.: Финансы и статистика, 1990. —295 с.
14. Саноцкий И.В. Индивидуальная реактивность и вероятность изменения здоровья человека при химических воздействиях (полемика по принципиальным вопросам) // Медицина труда и промышленная экология. —1993, N 3—4. —С. 9-12.
15. Саноцкий И.В., Уланова И.П. Критерии вредности в гигиене и токсикологии при оценке опасности химических соединений. М.: Медицина, 1975. —328 с.
16. Секей Г. Пародоксы в теории вероятностей и математической статистике. М.: Мир, 1990. —240 с.
17. Ташкер И.Д. Рецензия на книгу Г.К. Максимова, А.Н. Синицина "Статистическое моделирование многомерных систем в медицине" // Сов. медицина. —1984, N 10. —С. 118—119.
18. Ташкер И.Д. О статистических критериях и их использовании при гигиеническом контроле // Гигиена и санитария. —1991, N 12. —С. 85—87.
19. Трахтенберг И.М. Приоритетные аспекты проблем медицинской экологии в Украине (взгляд токсиколога) // Совр. проблемы токсикологии. —1998, N 1. —С. 5—8.
20. Трахтенберг И.М., Сова Р.Е., Шефтель В.О., Оникиенко Ф.А. Проблемы нормы в токсикологии. М.: Медицина, 1991. —208 с.
21. Тьюки Дж. Анализ данных, вычисления на ЭВМ и математика // Совр. проблемы математики. Сб. статей. —М.: Знание, 1977. —С. 41-64.
22. Фишер Р.А. Математика дамы, дегустирующей чай // Совр. проблемы математики. Сб. статей. —М.: Знание, 1981. —С. 46-58.
23. Хэтч Т. Значение допустимых пределов воздействия опасных веществ, присутствующих в воздухе рабочей зоны, рассматриваемое в аспекте предупреждения профессиональных заболеваний // Бюллетень ВОЗ, —авг. 1973. —Т. 47, N 2. —С. 153-161.
24. Человек. Медико-биологические данные. М.: Знание, 1977. —С. 36-40.
25. Шумейко В.М., Овруцький В.М., Глуховський И.В. Екологічна токсикологія: предмет, поняття, джерела виникнення // Совр. проблемы токсикологии. —1998. —N 1. —С. 55—63.


| Содержание |