NEC、少量の収集データで活用可能な機械学習技術を開発

cropped-logo_data1-32x32-449622ca518e516c1682d44a0dd426466825a7ae

NECは、機械学習技術で必要とされる大量のデータが得られない状況でも活用可能な、複数の機械学習技術を開発した。

近年、インターネット上に公開された豊富な画像等のデータに対して、ディープラーニングを代表とする機械学習技術が大きな効果を発揮し、様々な用途で活用されている。

しかし、データ収集の初期段階や、データ収集コストが高い環境のように学習データが大量に得られない状況では、これまでの機械学習技術はその効果を十分に発揮できないという課題があった。

特徴1:専門知識を持つ人のノウハウを取り入れて、学習効率の高いデータを能動的に収集

実世界で起こる状況を把握するためのフィールド調査を行うには、データ収集に大きなコストがかかるため、より少ない実験回数で学習することが求められる。

同技術は、業務や領域での専門知識を持つ人の物事の因果関係に関するノウハウ(肥料の成分と植物の育成の関係、等)を数値化して活用。これにより、学習効率の高いデータを能動的に収集し学習を行えるので、より少ない収集データで学習することが可能となり、データ収集コストを下げることができる。

特徴2:複数シミュレーション結果の類似度に基づいてパラメータ修正を繰り返すことにより正確なシミュレーションパラメータを推定

複雑なシミュレーションを行うには多数のシミュレーションパラメータが必要で、実データに合わせて正しくパラメータを調整する必要がある。しかし、実データが少なく、初期パラメータの見当がつかないと、従来の技術では実データに合うようなパラメータを推定できず、正確なシミュレーションが行えなかった。

同技術では、パラメータ値の異なる複数のシミュレーション結果の類似度に基づいたパラメータ値の修正を繰り返して、正しいパラメータ値を推定する。

特徴3:AIの分析結果に基づく意思決定時に、少数データの偏りに影響されにくい意思決定が可能な学習

効率的な資産配分の決定など、データから学習した結果に基づいて人の意思決定を支援することが期待される。しかし、学習データが少ないと、意思決定による効果を大きめに見積もってしまうという課題があった。

同技術は、収集したデータを学習用と効果評価用に複数の分割パターンを準備し、それぞれの効果評価結果を平均して、より正確な効果を見積もる。これにより、少数データの偏りに影響されにくく、より正しい意思決定ができるようになる。

なお、これらの成果の一部は、NEC-産総研人工知能連携研究室、国立情報学研究所、科学技術振興機構、統計数理研究所、Max Planck Institute for Intelligent Systemsとのオープンイノベーションによって得られた成果となる。

  • このエントリーをはてなブックマークに追加

関連記事

話題をチェック

  1. 600x601x20170822nana.jpg.pagespeed.ic.u5ed1iTQeL-e5b3de5c391c8e3805df72a8cdb3da051ece71fa

    ANA、機内食総選挙2017の結果発表 和食は牛すきやき丼、洋食はビーフシチューとオムライス

    Sponsored link  機上ӗ…
  2. MIT-Instant-Retouch-TA-12db540ca97a6020f2db78ca5b27647ac89d2f28

    機械学習を用いれば、写真が「撮影する前」からプロ仕様の美しさに──グーグルとMITがアルゴリズムを開発

    NEWS 2017.08.22 TUE 08:00マサチ&…
  3. GettyImages-496380034-e1503241697905-b18cea347ee2933a806af5a4adfa2f3d9569add1

    「世界共通のインターネット」を巡る、グーグルとカナダ最高裁との闘い

    NEWS 2017.08.21 MON 07:00カナダ&…
ページ上部へ戻る