統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

対数変換された説明変数のハザード比を真数の説明変数のハザード比に変換可能か?

対数変換した説明変数の単位数当たりのハザード比を、真数に戻した説明変数の単位数当たりのハザード比に計算できるだろうか?

論文で発表された数値を使うメタアナリシスを行うことはできるか?

つまり、生データがない場合である。

どういう状況か?

例えば、LDH を常用対数に変換した変数1単位ごとのハザード比を求めている研究があるとする。

これを、LDHが真数であるときの1単位ごとのハザード比に変換したいという状況である。

もし、生データがあれば、LDHを真数にしてハザード比を計算しなおせばよい。

このように再計算ができない場合、常用対数に変換した結果から、真数を使った結果を、計算によって求めることはできないだろうか?

真数1と常用対数1、それぞれの上昇の際の点推定値はどのような関係にあるか?

上記の結果をもって、あらためて、真数1と常用対数の1はどのような関係にあるか考えてみる。

LDHが、ある人は100、ある人は1000だったとする。

その差は900である。

このとき常用対数  \log_{10} 100,  \log_{10} 1000 はそれぞれ、2と3になる。

その差は1である。

ということは、上記の結果で、log10LDHの推定値が 0.7345 なので、常用対数で1上がるごとに +0.7345 なので、真数1あがるごとに 0.7345/900 = 0.0008161111 上昇するという計算になる。

一方で、LDHが1上がるごとの推定値は、0.0002675と計算されている。

上記の 0.0008161111 とは異なる。

この点推定値の観点から、変換はできないことがわかる。

そもそも同じ1上昇したときの点推定値が、理屈の上では正しい変換なのに、あっていない。

さらに考えると、LDH 1000と10000は、常用対数では3と4なので、やはり差が1である。

しかし、真数であると、差が9000になる。

この点が、常用対数と真数に変換するときのネックになっていると思う。

常用対数は同じ差なのに、真数では差がどんどん開くわけである。

これだとどのレベルの差1かによって、真数における差が異なるため、そう簡単な関数では変換できない。

対数変換の説明変数のハザード比を、真数の説明変数のハザード比に変換できないのはなぜか?

つまり、上記のように、常用対数で同じ1の差でも、真数にすると同じ差にならないため、一律の変換で対応できないからである。

常用対数でも、真数でも1上昇するときのハザード比を計算しているにすぎないので、その1が1:1対応になっていないなら、変換はできないわけだ。

単純に何倍されているという状態であれば、その何倍という数値で割ればよいだけだが、差が一定ではない数値同士の変換はできないというわけである。

逆に、対数変換した後の数値で、1単位上昇したときの点推定値というのは、イメージしがたいということになる。

対数変換した場合の点推定値は、その大きさ自体は理解しにくいものと思っているほうが無難である。

点推定値を解釈したい場合は、対数変換を施さないほうがよいと思う。

そもそも対数変換の必要はない

余談だが、回帰分析をする場合に、説明変数が正規分布している必要性はない。

説明変数が正規分布していないといけないと思っているから、対数変換という発想が出るのではないか?

正規分布が必要なのは、残差である。

重回帰分析の偏回帰係数を検定する場合、残差が正規分布している必要がある。

説明変数も目的変数も、正規分布している必要はない。

ただし、目的変数が正規分布していると、残差も正規分布する可能性が高いので、残差の正規分布のために目的変数の対数変換はありうる。

説明変数は、正規分布である必要はないので、その点は忘れないようにしたい。

toukeier.hatenablog.com

まとめ

対数変換された説明変数のハザード比を真数の説明変数のハザード比に変換可能かを考えてみた。

結果として、単純な計算で変換することはできないことがわかった。

対数変換後の1単位が、真数に戻したときのもとの数字の大きさによって、差が小さかったり大きかったりする。

なので、対数変換後の1単位を単純な変換関数で真数にすることはできなく、それゆえ真数の説明変数のハザード比を単純な変換で推定することはできない。

何等か参考になれば。