同意を得た顔写真収集でディープラーニングのためのデータセット作成
国立成育医療研究センターは、内閣府の戦略的イノベーション創造プログラム(SIP)のAI(人工知能)ホスピタルによる高度診断・治療システム事業への採択を機に、研究者、医師だけでなく全ての職員を対象としたデータサイエンスの啓蒙、教育活動を行っています。その研修における取り組みの一つとして、教師あり機械学習を用いてAIを構築するための顔写真データセットを作成しました。インターネットを利用し顔画像は比較的容易に集めることができますが、医学的および生物学的な応用を考えると姿勢は固定されていることが望ましく、さらに個人情報も保護する必要がありました。しかし、これまでにない規模の性別や笑顔などのラベル付きビッグデータ(2429枚、277名分)となり、データ拡張、転移学習を活用した畳み込みニューラルネットワークにより、性別は98.2%、笑顔は93.0%の認識精度を示すモデルを提示することができました。
小児の先天性疾患は特徴的顔貌を示すことが多く、画像認識による診断に期待が寄せられています。しかし、それらは希少疾患のため対象人数が少なく、大量データを必要とするディープラーニングによる実装を阻んでいます。今回の結果はAI構築に必要とされるデータ量の検討に活用され、今後のAI開発に指針を与えるものです。
発表論文情報
- タイトル:
- Collection of 2429 constrained headshots of 277 volunteers for deep learning
- 著者名:
- 青砥早希, 半谷まゆみ, 上野瞳, 植田亜季, 五十嵐麻希, 伊藤愛主, 塚本元子, 神野智子, 坂本美佳, 岡_有香, 長谷川冬雪, 緒方広子, 名村彩季, 小島一晃, 菊谷昌央, 松原圭子, 谷口公介, 岡村浩司*
- 所属:
- 国立成育医療研究センター データサイエンス研修
- 掲載紙:
- Scientific Reports (2022)
- URL:
- https://www.nature.com/articles/s41598-022-07560-2
- DOI:
- https://doi.org/10.1038/s41598-022-07560-2
特記事項
本研究は内閣府の戦略的イノベーション創造プログラム(SIP)「AI(人工知能)ホスピタルによる高度診断・治療システム」プロジェクトの支援を受けて行われました。性の判別については武田科学振興財団の特定領域研究「習学的アプローチによるヒトの性の多様性の解明」プロジェクトからも支援を受けました。
- 本件に関する取材連絡先
-
国立成育医療研究センター 企画戦略局 広報企画室
03-3416-0181(代表)
koho@ncchd.go.jp
月~金曜日(祝祭日を除く)9時〜17時
※医療関係者・報道関係者以外のお問い合わせは、受け付けておりません。