お知らせ 2024年9月1日よりconnpassサービスサイトへのスクレイピングを禁止とし、利用規約に禁止事項として明記します。
9月1日以降のconnpassの情報取得につきましては イベントサーチAPI の利用をご検討ください。

お知らせ connpassではさらなる価値のあるデータを提供するため、イベントサーチAPIの提供方法の見直しを決定しました。2024年5月23日(木)より 「企業・法人」「コミュニティ及び個人」向けの2プランを提供開始いたします。ご利用にあたっては利用申請及び審査がございます。詳細はヘルプページをご確認ください。

このエントリーをはてなブックマークに追加

Feb

9

第6回 Data-Centric AI勉強会

Organizing : Data-Centric AI Community

第6回 Data-Centric AI勉強会
Hashtag :#dcai_jp
Registration info

聴講枠

Free

Attendees
176

Attendees
takaoleparadoxe
TomonoriWakabayashi
oyazingi
upura
mino2018
sho124
tadashi_ohno
ichigotosakura
dwarfplanet7634
Takuya_DS
View Attendee List
Start Date
2024/02/09(Fri) 19:00 ~ 20:00
Registration Period

2024/01/11(Thu) 17:55 〜
2024/02/09(Fri) 20:00まで

Location

オンライン

オンライン

参加者への情報
(参加者と発表者のみに公開されます)
出席登録
(イベント開始時間の2時間前から終了時間まで、参加者のみに公開されます)

Description

イベント概要

AI開発における「データ」に着目した取り組みについて、世界的な動向や、様々な人・組織の知見・ノウハウなどを共有するための勉強会です。具体的なテーマとしては、例えばデータ収集の工夫、データ品質の評価・改善、アノテーションの効率化など様々なものが考えられます。データに主眼を置いたものを幅広く対象とします。

今回はLINEヤフー 横尾様、東工大 服部様から2件の発表です!

SNS等におけるハッシュタグは #dcai_jp でお願いいたします。

今後のData-Centric AI勉強会でのご発表を希望される方は以下のフォームよりお申し込みください。
Data-Centric AI勉強会発表申し込みフォーム

タイムテーブル

時間 講演者 内容
19:00-19:05 運営 オープニング
19:05-19:30 横尾 修平 大規模画像テキストペアデータのフィルタリング手法の紹介
19:30-19:55 服部 翔 東工大Swallowプロジェクトにおける大規模日本語Webコーパスの構築
19:55-20:00 運営 クロージング

発表内容

大規模画像テキストペアデータのフィルタリング手法の紹介

基盤モデルのための事前学習用のデータは「量」にフォーカスされがちですが、昨今では「質」の部分にも注目が集まっています。特に昨年開催されたDataCompは、データの質にフォーカスしたData-centricなコンペ設計となっており、データフィルタリングのノウハウが多数共有されました。本発表ではDataCompでの事例を中心に、最近の大規模画像テキストペアデータのためのフィルタリング手法について紹介します。

発表者 横尾 修平 様 (@lyakaap)

新卒でDeNAに入社後、2022年9月にLINEヤフー株式会社に中途入社し、現在は基盤モデルのデータ収集業務に従事。Kaggle Grandmaster。

東工大Swallowプロジェクトにおける大規模日本語Webコーパスの構築

東工大岡崎研究室と横田研究室が研究・開発を行った大規模言語モデル『Swallow』の学習にあたり独自に構築した『Swallowコーパス』は、現時点で商用利用が可能な日本語の言語モデルの学習コーパスの中で最大となっています。本発表では、その概要や具体的なコーパス構築手順について紹介します。

発表者 服部 翔 様 (@ayase_lab)

東京工業大学情報理工学院 情報工学系知能情報コース 岡崎研究室 修士1年

会場

オンライン (YouTube Live) で開催いたします。質疑応答はSlidoにて行います。YouTube Live及びSlidoのURLは開催前日に参加者の方にお知らせします。

※後日アーカイブ公開を予定しています。

配信スポンサー

GO株式会社様


          

Feed

kzykmyzw

kzykmyzwさんが資料をアップしました。

02/10/2024 09:14

kzykmyzw

kzykmyzwさんが資料をアップしました。

02/10/2024 09:14

kzykmyzw

kzykmyzwさんが資料をアップしました。

02/10/2024 09:12

kzykmyzw

kzykmyzwさんが資料をアップしました。

02/10/2024 09:11

kzykmyzw

kzykmyzwさんが資料をアップしました。

02/10/2024 09:11

kzykmyzw

kzykmyzw published 第6回 Data-Centric AI勉強会.

01/11/2024 17:55

第6回 Data-Centric AI勉強会 を公開しました!

Ended

2024/02/09(Fri)

19:00
20:00

Registration Period
2024/01/11(Thu) 17:55 〜
2024/02/09(Fri) 20:00

Location

オンライン

オンライン

オンライン

Organizer

Attendees(176)

takaoleparadoxe

takaoleparadoxe

第6回 Data-Centric AI勉強会 に参加を申し込みました!

TomonoriWakabayashi

TomonoriWakabayashi

第6回 Data-Centric AI勉強会 に参加を申し込みました!

oyazingi

oyazingi

第6回 Data-Centric AI勉強会 に参加を申し込みました!

upura

upura

第6回 Data-Centric AI勉強会 に参加を申し込みました!

mino2018

mino2018

第6回 Data-Centric AI勉強会 に参加を申し込みました!

sho124

sho124

第6回 Data-Centric AI勉強会 に参加を申し込みました!

tadashi_ohno

tadashi_ohno

第6回 Data-Centric AI勉強会 に参加を申し込みました!

ichigotosakura

ichigotosakura

第6回 Data-Centric AI勉強会 に参加を申し込みました!

dwarfplanet7634

dwarfplanet7634

第6回 Data-Centric AI勉強会 に参加を申し込みました!

Takuya_DS

Takuya_DS

第6回 Data-Centric AI勉強会 に参加を申し込みました!

Attendees (176)

Canceled (6)