Group Description
Data-Centric AIとは
Google Brainの共同設立者であり世界有数のAI研究者であるAndrew Ng先生が2021年の講演の中で使い始めた言葉です。従来、AI開発においては与えられたデータに対していかに機械学習モデルを改善していくかに注目が集まりがちでした。このようにデータを固定してモデルを改善していくアプローチはModel-Centric AI(モデル中心のAI)と呼ばれますが、Data-Centric AI(データ中心のAI)は逆にモデルを固定してデータを改善していくアプローチです。これらは二者択一ではなくいずれも重要であり、実プロジェクトにおいては両面から取り組むことが多いですが、モデル改善の方がAI開発の花形として多く語られているのが実情です。Andrew Ng先生はあえてData-Centric AIという言葉を使うことによって、AI開発におけるデータ改善の重要性、またその体系化の必要性を訴えていると考えられます。
このグループの目的
AI開発における「データ」に着目した取り組みについて、世界的な動向や、様々な人・組織の知見・ノウハウなどを共有する場を提供することを目的とします。基本的には定期的な勉強会を開催していくことを予定していますが、様々な活動形態を模索していきたいと思います。
勉強会の具体的なテーマとしては、例えばデータ収集の工夫、データ品質の評価・改善、アノテーションの効率化など様々なものが考えられます。データに主眼を置いたものを幅広く対象とします。
関連リンク
勉強会の情報など、Twitterで発信していきますのでフォローをお願いします!
Twitter: dcai_community_jp