化学物質とその効果との間でデータ解析して関係性を解明しよう!

公開日: 2016年6月12日日曜日

bsTSI85_ryokucya

緑茶の成分、ダウン症患者の認知能力向上に効果 研究 (Yahoo! ニュース)

まさか緑茶の成分がダウン症患者の認知能力構造に効果があるとは、誰も思いませんでした。驚くべき研究成果です。

ただ、データ解析ってこういうの、得意なんですよね。緑茶の成分だけでなく、考えられない成分に、考えられない効果があることを見つけられます。人が思いもよらないことを、機械学習やデータマイニングによって発見できちゃうんです。

今回の例でいえば、緑茶の成分だけでなく、いろいろな化学物質のデータと、それを飲んだとき食べたときの効果に関するデータがあります。

たとえば、化学物質のデータについて、化学構造に関する情報を数値で表しておくわけです。この数値化された情報と、その化学物質の効果との関係を機械学習によって学習させます。

ここで学習されたモデルがあれば、あらたな化学物質の化学構造を数値化したデータをモデルに入力することで、その化学物質によってどんな効果が得られるか推定できます。

これによって、『え、こんな物質にこんな効果があったの!?』といった物質を探すことができます。

 

このデータ解析に必要な機械学習やデータマイニングの手法

  • データの見える化・可視化手法
  • クラスタリング手法
  • クラス分類手法

具体的な手法に関する情報についてはこちら

実際にデータ解析するときのプログラムはこちら

  • ?±??G???g???[?d????u?b?N?}?[?N???A