WMW検定をCONSORTに対応させる難しさ

こんにちは。
株式会社オルトメディコ統計解析課の柿沼です。

Wilcoxon-Mann-Whitney検定の解析結果をCONSORTに対応させるヒントをまとめました。

学位

修士 (工学)
経歴

～2014年3月日本大学大学院理工学研究科物質応用化学専攻修了
2014年4月～研究開発部統計解析課
役職

課長
実績・得意案件

シミュレーション
趣味

旅行
好きな言葉

無知の知
連絡先

planning-department@orthomedico.jp

SNSでもお役立ち情報を配信しています！いいね・フォローをお願いします。

1　はじめに

ランダム化比較試験 (RCT) の報告は、透明性と一貫性を保つためにCONSORTガイドラインへの準拠が重要ですよね。これは、機能性表示食品においても同様です。中でも、推定値の選択は、結果の解釈と臨床的意義を明確にするための重要な要素になります。

Wilcoxon-Mann-Whitney (WMW) 検定は、順序データや非正規分布データを扱う際の主要な手法として広く使われています。帰無仮説は、「2つの独立した群の分布が同一である。」です。しかし、WMW検定を採用した場合、CONSORTに対応させるにはひと工夫がいるのです。

ちなみにWMW検定は、

● Mann–WhitneyのU検定
● Wilcoxonの順位和検定

とも呼ばれる検定方法です。

私は、「Mann–WhitneyのU検定」派ですが、このメルマガでは間をとってWMW検定と呼ばせてください。

さっそくCONSORTを確認していきましょう。

CONSORTの「Outcomes and estimation」には以下のように記載されています。

17a	主要アウトカムおよび副次的アウトカムごとに、各群の結果、推定効果量およびその精度（95％信頼区間など）。 For each primary and secondary outcome, results for each group, and the estimated effect size and its precision (such as 95% confidence interval)
17b	二値アウトカムについては、絶対的効果量と相対的効果量の両方を提示することが推奨される。 For binary outcomes, presentation of both absolute and relative effect sizes is recommended

CONSORTに対応させるには、推定効果量およびその精度を示さないといけません。

みなさん。これに対応できているでしょうか?

t検定のように平均値を比較する場合は、群間差とその信頼区間を示せばよいので、簡単ですよね。
(effect sizeという単語が使われていますが、Cohenのdのようなstandard effect sizeではないので注意して下さい。)

正直なところ、連続変数なら平均値の比較をしたり、正規性がないなら対数変換したり、順序カテゴリカル変数なら2値変数に変換したりしたほうが解釈しやすいですよね。

でも、どうしてもWMW検定をしたい時ってありますよね。
そんな時は、どうすれば良いのでしょうか?

2　2つの推定方法

WMW検定において介入効果を推定する方法を2つ紹介します。この方法を用いることで、CONSORTに対応できます。

その方法とは・・・

● Hodges-Lehmann (HL) 推定値
● Wilcoxon-Mann-Whitney odds (WMWodds)

です。

聞いたことはありますか?
それぞれの特徴を紹介しますね。

3　Hodges-Lehmann (HL) 推定値

これは有名ですよね。SPSSにも実装されています (NPTESTS)。SASならPROC NPAR1WAY、Rなら標準関数のwilcox.test() を使えば算出できてしまいます。また、DescToolsパッケージのHodgesLehmann() でも算出できます。

HL推定値は、中央値に基づく手法であるため、外れ値の影響を受けにくいです。なので、WMW検定にとって、頑健な推定量と考えられます。しかも、信頼区間も計算できるのでCONSORTに対応できますね。

しかし、この推定値は中央値を基準にした点推定値であるため問題があります。例えば、リッカートスケールのような限られた選択肢で測定が行われている場合、回答の重複が多くなる可能性があり、これにより推定値に差がないにも関わらず、有意確率は5%を下回るといった矛盾が生じ、結果の解釈が難しくなる場合があります。

なので、なかなか扱いが難しいのです。

4　Wilcoxon-Mann-Whitney odds (WMWodds)

そこで、今回ご紹介したいのが、Wilcoxon-Mann-Whitney odds (WMWodds) です。
HL推定値が中央値基準なのに対して、WMWoddsは順位情報をもとに算出するので、HL推定値で解釈が困難な状況でも対応できます。

残念なことに実装されているソフトウェアは今のところないです。
なので、聞いたことはないかもしれません。

信頼区間も計算できるので、CONSORTに対応することができます。
この信頼区間の計算が難しいのです。

どのような計算がされているかは、冗長になるのでここでは省きますが、弊社ではWMWoddsとその信頼区間をRで計算できるようにプログラムを準備しました。

なので、WMW検定を実施したい時は、安心してオルトメディコにおまかせください。

5　まとめ

WMW検定の結果をCONSORTに対応させる方法を紹介しました。

WMW検定を採用している機能性表示食品のヒト試験もいくつか存在していると思います。是非、今回紹介した方法を用いてCONSORTに対応した報告をしてみてください。

これらの内容の詳細は、年内のどこかでNew Food Industryという雑誌に論文形式でまとめようと考えているので、その際はお手に取って読んでみていただけると幸いです。

これからWMW検定で介入効果の推定値を算出したいという方は、弊社までお問合せお願いします。一緒にCONSORTに対応した統計解析をしましょう。

6　参考文献

●	Schulz KF, Altman DG, Moher D; CONSORT Group. CONSORT 2010 statement: updated guidelines for reporting parallel group randomised trials. BMJ. 2010; 340: c332. (PMID: 20332509)
●	Moher D, Hopewell S, Schulz KF, Montori V, Gøtzsche PC, Devereaux PJ, Elbourne D, Egger M, Altman DG. CONSORT 2010 explanation and elaboration: updated guidelines for reporting parallel group randomised trials. BMJ. 2010; 340: c869. (PMID: 20332511)
●	Butcher NJ, Monsour A, Mew EJ, Chan AW, Moher D, Mayo-Wilson E, Terwee CB, Chee-A-Tow A, Baba A, Gavin F, Grimshaw JM, Kelly LE, Saeed L, Thabane L, Askie L, Smith M, Farid-Kapadia M, Williamson PR, Szatmari P, Tugwell P, Golub RM, Monga S, Vohra S, Marlin S, Ungar WJ, Offringa M. Guidelines for Reporting Outcomes in Trial Reports: The CONSORT-Outcomes 2022 Extension. JAMA. 2022; 328 (22): 2252-2264. (PMID: 36511921)
●	Acion L, Peterson JJ, Temple S, Arndt S. Probabilistic index: an intuitive non-parametric approach to measuring the size of treatment effects. Stat Med. 2006. Erratum in: Stat Med. 2007; 26 (18): 3524. (PMID: 16143965)
●	DeLong ER, DeLong DM, Clarke-Pearson DL. Comparing the areas under two or more correlated receiver operating characteristic curves: a nonparametric approach. Biometrics. 1988; 44 (3): 837-45. (PMID: 3203132)
●	Divine G, Norton HJ, Hunt R, Dienemann J. Statistical grand rounds: a review of analysis and sample size calculation considerations for Wilcoxon tests. Anesth Analg. 2013; 117 (3): 699-710. (PMID: 23456667)
●	Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology. 1982; 143 (1): 29-36. (PMID: 7063747)
●	Newcombe RG. Confidence intervals for an effect size measure based on the Mann-Whitney statistic. Part 1: general issues and tail-area-based methods. Stat Med. 2006; 25 (4): 543-57. (PMID: 16252269)
●	Newcombe RG. Confidence intervals for an effect size measure based on the Mann-Whitney statistic. Part 2: asymptotic methods and evaluation. Stat Med. 2006; 25 (4): 559-73. (PMID: 16217835)