[2023-06-27]rinna株式会社が日本語特化した2種類のGPT言語モデルを公開

2015年メッセンジャーアプリLINEに突如誕生したA I女子高生「りんな」をご存知でしょうか。LINEの友だち登録をすることでアプリ上で会話を楽しむことができ、当時高校生を中心に話題になりました。当時としては異例の、自然でスピード感のある会話が可能でした。そんな驚くべきサービスを提供しているrinna株式会社は、OpenAIが公開している大規模言語モデルシリーズ「GPT」を日本語に特化させる研究、開発に注力しています。

2021年にOpenAIが提供する大規模言語モデルGPT-2を利用し、日本語に特化した「GPT2-medium」という3億強のパラメータを持つモデルを公開し、話題になりました。その翌年2022年には13億パラメータを持つGPT-2の日本語モデルを公開し、着実に進歩を続けています。そして2023/5/17、36億パラメータを持つ汎用言語モデル「japanese-gpt-neox-3.6b」と対話言語モデル「japanese-gpt-neo-3.6b-instruction-sft」の2種類のGPT言語モデルを公開しました。

汎用言語モデルは日本語に特化したGPT言語モデルで、開発者自身がここから様々な分野に特化させることが可能です。例えば、日本語を関西弁や熊本弁に翻訳するアプリケーションなど面白いかもしれません。

対話言語モデルは日本語での対話に特化したGPT言語モデルです。チャットボットの開発をする際に大いに役立つでしょう。

GPTシリーズは基本的に英語のテキストデータを学習しているため、英語圏の視点、価値観、事実認識などに偏る出力をする可能性がありました。また、日本語の入力に対しより正確な理解をし、より適切な出力をするためには日本語特化のモデルが必要と考えられていました。rinna社が提供するこの二つのモデルを使うことで、日本人向けの様々なサービスの開発や研究の発展が期待されます。

驚くべきことに、この二つのモデルが公開された同日に、株式会社CyberAgentが国産大規模言語モデル「OpenCALM」を公開しました。2023/5/17は日本の自然言語処理技術における革新的な一日であると言えるでしょう。


参考

https://rinna.co.jp/news/2023/05/20230507.html

AIりんなの各種サービスについて興味がある方はこちらもご覧ください。

https://www.rinna.jp/

(著:藤本)

視聴済みにして続ける