Рецензия на работу С.М.Волкова с соавторами - Вместе против рака

    Рецензия на работу С.М.Волкова с соавторами

    Для отрицательной оценки всей статьи достаточно отрицательного ответа хотя бы на один поставленный вопрос. В нашем же случае можно ответить "нет" на все вопросы.

    Далее объясним по пунктам.

    1. Актуриальный анализ или, что проще и понятнее, анализ таблиц дожития - это метод, распространенный в "докомпьютерную" эпоху в виду относительной простоты требуемых расчетов. Сейчас он используется лишь при анализе большых объемов агрегированных данных, когда первичные данные не доступны. Точность его значительно ниже чем при оценке кривых дожития по первичным данным ("настоящая" оценка Каплана-Майера или продукт-лимит метод). В актуриальных методах данные о продолжительности жизни при агрегировании существенно огрубляются (с дней до годов), что естественно ведет к снижению точности оценки характеристик выживаемости. Ссылки на сложность вычислений не должны приниматься во внимание, т.к. почти все современные статистические пакеты имеют в своем составе процедуры анализа выжимаемости.

    2. Стандартным путем изобретения и внедрения новых методов статистического анализа является следующая последовательность шагов: вывод формулы, аналитическое исследование сравнительной эффективности, компьютерный эксперимент методом Монте-Карло, реализация метода в виде пользовательской программы, сообщение в аудитории специалистов, способных проверить правильность математических выкладок, публикация в специализированном (статистическом) журнале, пропаганда метода в аудитории потенциальных пользователей. В настоящем случае ряд промежуточных шагов был пропущен. Конечных пользователей можно не убеждать в высокой эффективности предлагаемого метода анализа, достаточно ссылки на серьезный журнал и мнение специалистов.

    3. Метод не прошел экспертизы специалистов. Уровень депонирования статьи - явно не достаточен. Единственный рецензент-эксперт и тот справедливо указал на незавершенность математических выкладок.

    4. Предлагаемый метод излагается как итеративный, хотя рецензент Дукарский указал точную и простую прямую формулу. Проводить вручную (программа автором не предлагается) последовательные вычисления, когда есть совсем простая формула - более чем странно.

    5. Авторы сравнивают четыре оценки: Катлера-Едерера, Меркова, "Каплана-Майера", Волкова. Если проделать элементарные алгебраические выкладки и использовать одинаковые обозначения (это обязан был бы сделать автор), то получаются следующие формулы для оценки смертности в i-строке таблицы дожитития:

    • Оценка Катлера-Едерера: qi= di/(ni-wi/2) (1)
    • Оценка Меркова: qi = di/(ni - (di + wi)/2) (2)
    • Оценка Волкова: qi= di/( ni -wi) (3)
    • Оценка "Каплана-Майера": qi = di/ni (4)

    где q; - смерность в (i, i+l) интервале, d; - число случаев (смертей) в (i, i+l) интервале, w; - число цензурированных наблюдений (не проживших и вышедших из под наблюдения) в (i, i+l) интервале, п, - число обследуемых в начале (i, i+l) интервала, т.е. в i-момент времени.

    Теперь о корректности включения методов в этот список сравнения. Реально в классическом анализе таблиц дожития используется только оценка Катлера-Едерера (1).

    Оценку (2) нельзя всерьез рассматривать. Это устаревшая сугубо эмпирическая формула, которая дает смещенную в положительную сторону оценку. В некоторых случаях она дает вообще абсурдный результат. Например при п=10, d=10, w=0 смертность равна 200% (q=2), и следовательно выживаемость - отрицательная, -100%.

    В оценке (4) имена Каплана и Майера взяты в кавычки, т.к. оценка (4) не применяется в анализе таблиц (см. например описание метода LIFETABLE процедуры LIFETEST в документации статистического пакета SAS), так как она дает, как справедливо указывает автор, заниженную оценку смертности. Оценка Каплана-Майера является основой продукт-лимит анализа для построения кривых дожития по первичным данным. Использование ее в анализе таблиц дожития - неграмотно, дискредитирует и метод, и оценку в глазах конечных пользователей. Таким образом в списке "сравнения" должны остаться только две оценки: классическая формула актуариального анализа (1) и предлагаемая оценка авторов (3). Если трудно провести аналитическое исследование эффективности нового метода, принято проводить компьютерный эксперимент на модельных примерах, где можно набрать статистику о систематических и случайных ошибках сравниваемых методов.

    Реальные данные используются обычно на конечной стадии в качестве иллюстрации.

    6. То что формула (3) - это именно метод автора, доказывается не только аналитически (это простые алгебраические выкладки) но и проверено на примерах авторов. Если внимательно посмотреть на формулу (3), то очевиден вывод, что авторы вообще не предложили нового метода обработки таблиц дожития. Именно так и считали до появления первых работ по анализу цензурированных данных. Смертность оценивается как отношение числа случаев к числу обследуемых за вычетом вышедших по разным причинам из исследования! Т.е. из анализа просто исключаются цензурированные наблюдения, что очевидно приводит к завышенной оценки смертности. В некоторых случаях этот метод (как и метод Меркова) приводит к абсурдным результатам. Например при п=100, d==l, w=99 оцениваемая смертность равна 100% (q=l), и следовательно выживаемость - нулевая, хотя очень вероятно, что хотя бы часть из оставшихся 99 обследованых доживет до конца года.

    Вывод Предлагаемая авторами методика анализа таблиц дожития - ошибочна и не оригинальна. Нет никаких аргументов отказываться от стандартных классических процедур, хорошо документированных и содержащихся в современных пакетах статистических программ. Статья не может быть принята к публикации. Авторам рекомендуется не пользоваться данной методикой при анализе данных и подготовке публикаций в другие журналы.

    Рецензенты: к.т.н.С.М.Куликов, и доктор мед. наук, проф. В. Г. Савченко

    Смотрите также: