Пропустить команды ленты
Пропустить до основного контента
SharePoint
дек 10
Проект статьи о статистике в аналитической химии
Уважаемые коллеги!
 
Я Василий Дементьев, сотрудник Лаборатории молекулярного моделирования и спектроскопии.
 
Ко мне обратился Л.А. Грибов с идеей написать статью, предположительно для Аналитической химии. Тема - какие из рецептов математической статистики могут быть полезны для исследователей в области аналитической химии.
 
Естественно, я не мог взять под козырек и тут же написать. Поскольку сам непосредственно в аналитической химии на работаю. Но, опираясь на свой опыт сотрудничества со специалистами из других областей знания, я поразмышлял и написал проект статьи. Приглашаю поразмышлять со мной вместе. Вот ссылка на проект.
Свои замеания прошу оставлять в форме ЗАМЕТОК. Поступившие замечания можно прочесть, щелкнув ссылку ЗАМЕТКИ внизу страницы.
 
Спасибо за внимание.

Заметки

Отзыв от М.К. Беклемишева и А.В. Гармаша

Уважаемый Василий Александрович!

Спасибо за тот большой труд, который Вы проделали, чтобы написать проект этой статьи. Этот труд ценен: Вы описали вещи, доселе неведомые, я думаю, большинству российских аналитиков, и поэтому в каком-то виде материал обязательно должен увидеть свет в ЖАХе.
Следует лишь понять, какова оптимальная форма его представления.
Я попросил доц. А.В.Гармаша (основного специалиста по мат. методам на нашей кафедре) посмотреть Вашу рукопись. Вот его замечания.
1. Автор справедливо отмечает, что "статистическая культура" многих химиков-аналитиков недостаточна, что проявляется в механическом и часто неадекватном применении статистических критериев, их ошибочной интерпретации, некорректной с метрологической точки зрения постановке эксперимента, да и просто в путанице на уровне основных понятий. Но в то же время статья рассчитана на весьма подготовленную аудиторию. Например, неискушенному читателю нелегко будет понять, почему, например, если "Y и X связаны линейной зависимостью (...), [то] ro = +-1, и в правой части (6) появляется неопределенность типа inf*0" (да и если в конце концов он разберется в этом, проделав все выкладки, - какую практическую пользу он сможет извлечь из этого знания?). В этом противоречие статьи.
2. Первая часть статьи (до с.11) посвящена классическим методам математической статистики, к которым автор не скрывает своего критического отношения. Однако сомнительно, чтобы неподготовленный читатель четко осознал, чем же именно нехороши эти так привычные ему методы.
3. При рассмотрении имитационных статистических методов (вторая часть статьи) автор не упоминает об их возможных слабых местах. А они на самом деле есть, как и у классических методов. В основе имитационных методов на самом деле тоже лежат некоторые (неявные) априорные предположения о характере распределения данных. Поэтому какие методы лучше - традиционные или имитационные - вопрос дискуссионный. (Подобную статью и можно было бы напечатать в разделе "Дискуссии", но никак не в разделе "Консультации".)
4. Статья содержит ряд неточных или туманных формулировок.
а) Утверждение на с. 9 "... оно [значение r] всегда остается меньшим, чем ro", – строго говоря, ошибочно: любая выборочная оценка может быть как меньше, так и больше соответствующего генерального параметра. Там же: "теоретические дисперсии [речь, видимо, о генеральных значениях? - А.Г.] всегда меньше их эмпирических оценок" - аналогичное замечание.
б) На с. 10: "Разница в том, что в этом случае [когда число переменных больше 2] для описания связей между случайными величинами пользуются не коэффициентами корреляции, а парными ковариациями" - это также неверно: независимо от числа переменных, можно использовать как корреляции, так и ковариации.
в) Иногда критика классических методов статистики некорректна. Например, формула (8) приведена как аргумент того, что оценка доверительного интервала для величин ro затруднена. Но приближенная формула (8) - не единственная для оценки такого доверительного интервала. Есть и другие формулы - тоже, правда, приближенные, однако обычно дающие более реалистическую оценку, почему не воспользоваться ими?
г) На с. 4 против оценивания доверительного интервала традиционными методами выдвинут следующий аргумент: "Мы любим сделать три измерения, найти среднее и найти delta xср = s/3**1/2. С какой же надежностью Q мы утверждаем, что xср лежит в интервале x= xср+-delta xср? Оказывается, Q = 57,7%. Маловато для приличного результата". Однако приведенный "способ" расчета доверительного интервала есть как раз пример статистической безграмотности, который желательно было бы прокомментировать и показать, в чем же он ошибочен и как надо считать на самом деле. Сами по себе классические методы математической статистики тут ни при чем.

Итоговые предложения:

А. Программа-минимум: статья будет посвящена в основном имитационным методам статистики. (Она получает такое название.) Учтывается замечание № 3 (т.е. рассматриваются ограничения как классических, так и имитационных методов).
   Программа-максимум: статья будет посвящена как недостаточной статистической культуре (аналитиков), так и имитационным методам. Проводится некая систематизация материала о неадекватном применении статистических методов. Учитывается замечание № 1.

Б. Статья направляется в рубрику "Дискуссии".

Просим сообщить свое мнение по поводу этих предложений.

М.К.Беклемишев,
А.В.Гармаш
Замещающая рамка рисунка: Дементьев
  • Дементьев
 на 26.01.2011 0:26