朝日新聞社CTO室

朝日新聞社CTO室はテックファーストの技術戦略をマネジメントする組織として今年4月に発…

朝日新聞社CTO室

朝日新聞社CTO室はテックファーストの技術戦略をマネジメントする組織として今年4月に発足しました。 ここではITエンジニアの採用関連情報やテックイベント情報など、エンジニアに関わる様々な情報を発信していきます。

マガジン

  • メディア研究開発センター

    朝日新聞社の研究開発チーム(メディア研究開発センター)のテックブログです

リンク

求人

  • 求人の画像

    【ICT企画部】セキュリティーエンジニア(CSIRTメンバー)

    正社員
  • 求人の画像

    【サービス開発部】テックリード/デジタル事業の内製開発

    正社員
  • 求人の画像

    【サービス開発部/ビジネス開発部】プロジェクトマネージャー

    正社員

記事一覧

【作業に集中したいから】Notionマイタスクで複数プロジェクト管理&ドキュメント化

こんにちは。マルチタスクが苦手なのにプロジェクトを掛け持ちしすぎているM研の杉野です。 今年2024年にリリースされ、Notion愛好家?の間で賞賛されている「マイタスク」…

夏のインターンシップ・エンジニアコース1dayを開催しました!

夏のインターンシップの一環としてエンジニアコース1dayを開催しました 8月24日(土)の東京本社会場には約30人にご参加いただきました。 チームに分かれ、 ①CMS(コン…

朝日新聞社CTO室、公式noteはじめました

こんにちは。 朝日新聞社CTO室採用担当です。 CTO室は「テックファーストの技術戦略をマネジメントする組織」として2024年4月に発足しました。 全社のエンジニアを横軸で…

mackerelでオンプレサーバーの監視を強化してみたら幸せになった

いつもM研テックブログをご覧いただきまして、ありがとうございます。朝日新聞社メディア研究開発センター(M研)の田森です。 さて、M研では研究用のGPU搭載サーバーをは…

Pythonで扱う地理情報データ! 面と点の内外判定で土砂災害警戒区域の「盲点」を探る

こんにちは。朝日新聞社メディア研究開発センターの石井奏人です。 突然ですが、みなさんは土砂災害警戒区域についてご存知でしょうか。 土砂災害が起こる危険性のある箇…

LLMによる日本語タイポ修正ベンチマーク

こんにちは。メディア研究開発センター(通称M研)の田口です。 昨年6月末にこんな記事を書きました。このときはgpt-35-turbo、text-davinci-003を使っていて今読み返すと…

モノに関わる職業をLLMで分析!

今回やったこと ・Azure OpenAI Serviceのapiで、gpt-4oを使用  ・プロンプトの工夫(結果をpythonのリスト形式で出力したい)  ・画像認識 ・pythonで関係図を作る(ネ…

LLMは文分類を抽象的に学ぶことはできるか?

メディア研究開発センターの新妻です。 LLMのブーム、すごいっすよね。 (この記事においては、LLMは大規模なdecoder onlyな言語モデルを指して使います。) 自分も最近は…

GPT-4oは画像の座標情報を理解しているのか?

こんにちは。朝日新聞社メディア研究開発センターの嘉田です。 早速ですが、みなさんはGPT-4oを使っていますか? GPT-4oは画像認識精度も上がっていて日本語OCRもできる!…

LLMを使ったかな漢字変換

こんにちは。メディア研究開発センターの山野です。私は普段は音声処理や自然言語処理やそれらの技術を使ったプロダクト開発などに従事しています。 さて今回は朝日新聞記…

【LLM】Few-shot推論は言語化の壁を越えられるか

こんにちは。メディア研究開発センターの川畑です。 みなさん ChatGPT 使ってますか?便利ですよね。何か訊いたら大概のことは正確に教えてくれますし、論文等の文書もわ…

LLMのTraceabilityについて素人が考えてみた

はじめにメディア研究開発センターの村瀬です。よろしくお願いします。 今回のブログはLLMやDeep Learningについて初学者の私がLLMのTraceabilityについて考えてみたという…

『AIは短歌をどう詠むか』という本

はじめにみなさん、こんにちは。メディア研究開発センター(M研)の浦川です。私は普段、自然言語処理(書き言葉から話し言葉まで、日常生活で普通にヒトが使う言葉をコン…

【Presented by AWS Japan】 DynamoDB勉強会を開催してもらいました

こんにちは!朝日新聞社メディア研究開発センターの嘉田です。 今回は、先日AWSさんに開催していただいたDynamoDB勉強会についてご紹介します。 経緯弊センターではAWSを…

LLMは本当になんでも得意なの?TSUNAの文字数コントロールを検証

朝日新聞社メディア研究開発センター 田森です。 ゴールデンウィークがいよいよ始まりますね。メディア研究開発センターも4月には新年度を迎えワチャワチャしていました…

SAR衛星画像で能登半島地震の被災状況を把握する初めてのトライ

はじめに地震や、台風などの自然災害が発生した時に、一番重要なのは被害状況を迅速に把握することです。それによって、迅速かつ適切な救援や、復旧、生活再建活動を行うこ…

【作業に集中したいから】Notionマイタスクで複数プロジェクト管理&ドキュメント化

こんにちは。マルチタスクが苦手なのにプロジェクトを掛け持ちしすぎているM研の杉野です。 今年2024年にリリースされ、Notion愛好家?の間で賞賛されている「マイタスク」機能をご存知でしょうか?複数プロジェクトを皿回しする民にとって、これは救世主だと思うほど良い機能であると、今さら気づきました。今回はその「マイタスク」を使い、さらにその日のタスクに集中しやすくなるためのカスタマイズから、ドキュメント漏れやドキュメント迷子の悩みを解決する工夫までご紹介します。 プロジェクト

夏のインターンシップ・エンジニアコース1dayを開催しました!

夏のインターンシップの一環としてエンジニアコース1dayを開催しました 8月24日(土)の東京本社会場には約30人にご参加いただきました。 チームに分かれ、 ①CMS(コンテンツ・マネジメント・システム)によるメディアサイト作成 ②IT技術活用のアイデアソン ③若手社員との座談会 を行いました。 若手のエンジニア社員8人が、それぞれ自分が所属する部署の仕事内容を紹介しました。また、グループワークではリーダー役となり、日ごろの業務経験を生かして参加者の疑問に答えるなど、ワ

朝日新聞社CTO室、公式noteはじめました

こんにちは。 朝日新聞社CTO室採用担当です。 CTO室は「テックファーストの技術戦略をマネジメントする組織」として2024年4月に発足しました。 全社のエンジニアを横軸でマネジメントし、社業の成長に貢献するエンジニア組織の実現を目指しています。 開発組織をアップデートしていくために、キャリア採用(中途採用)にも力を入れています。 エンジニアのみなさんに弊社のことを知っていただきたく、note を開設しました。 ぜひこちらもご覧ください👇 このnoteでは、今後もエン

mackerelでオンプレサーバーの監視を強化してみたら幸せになった

いつもM研テックブログをご覧いただきまして、ありがとうございます。朝日新聞社メディア研究開発センター(M研)の田森です。 さて、M研では研究用のGPU搭載サーバーをはじめとして、何台かのオンプレサーバーやNASが存在します。 結構台数があるので、それなりの管理が必要なのですが、中でも困っているのは 各ストレージはどれくらい使われているのか? GPUはどのサーバーででどのくらい動いているのか? がなかなか分かりづらい。これらの項目を含めて、サーバーの状況を包括的に監視

Pythonで扱う地理情報データ! 面と点の内外判定で土砂災害警戒区域の「盲点」を探る

こんにちは。朝日新聞社メディア研究開発センターの石井奏人です。 突然ですが、みなさんは土砂災害警戒区域についてご存知でしょうか。 土砂災害が起こる危険性のある箇所を、各都道府県が土砂災害防止法に基づき指定したものです。 では、どれほどの土砂災害が実際に警戒区域の中で起きているのでしょうか。 朝日新聞社では、土砂災害警戒区域と、2021年、2022年に起きた土砂災害の発生箇所を分析し、「警戒区域の外」で起きた土砂災害を探しました。 分析の結果は、朝日新聞・朝日新聞デジタル

LLMによる日本語タイポ修正ベンチマーク

こんにちは。メディア研究開発センター(通称M研)の田口です。 昨年6月末にこんな記事を書きました。このときはgpt-35-turbo、text-davinci-003を使っていて今読み返すと隔世の感ですね… 現在も要約関連のことをやっているのかというと、最近のメインの業務は「Typoless」という校正支援AIサービスの開発に従事しています。AI校正機能からその他解析API群の整備・運用まで幅広くやっています。Typolessについては昨年末にPdMがnoteを書いている

モノに関わる職業をLLMで分析!

今回やったこと ・Azure OpenAI Serviceのapiで、gpt-4oを使用  ・プロンプトの工夫(結果をpythonのリスト形式で出力したい)  ・画像認識 ・pythonで関係図を作る(ネットワークグラフ) はじめに後輩ができました、2年目の河﨑です。 夏になり、M研にも新入社員が配属されてきました。 朝日新聞社の技術職の新入社員は、4月に入社してから5ヶ月間の技術者研修を受けます(手厚い!)。 ネットワークの基礎に関する講義を受けたり、システム構築実習

LLMは文分類を抽象的に学ぶことはできるか?

メディア研究開発センターの新妻です。 LLMのブーム、すごいっすよね。 (この記事においては、LLMは大規模なdecoder onlyな言語モデルを指して使います。) 自分も最近は継続事前学習とか頑張ってます。 NLPには文分類(sentence classification)という基礎的なタスクがあります。 具体的なタスクで言えば、含意関係認識や感情解析などの与えられた文に対して限られた選択肢からラベルを付与するようなタスクです。 この文分類については、既存のBERTな

GPT-4oは画像の座標情報を理解しているのか?

こんにちは。朝日新聞社メディア研究開発センターの嘉田です。 早速ですが、みなさんはGPT-4oを使っていますか? GPT-4oは画像認識精度も上がっていて日本語OCRもできる!と評判ですが、バウンディングボックスも出力できるのか?そもそもGPT-4oは画像の座標情報をどの程度扱えるのだろうか?と疑問に思い、検証することにしました。 検証方法正しい座標を出力できるか、与えた座標を理解できているか、物体間の位置関係を理解できているか、という観点で確認するべく、下記の3つの方法

LLMを使ったかな漢字変換

こんにちは。メディア研究開発センターの山野です。私は普段は音声処理や自然言語処理やそれらの技術を使ったプロダクト開発などに従事しています。 さて今回は朝日新聞記事データを使ったニューラル仮名漢字変換について簡易な実験をしたのでその結果を共有します。 はじめに多くの問題を解くことができるLLMですが、ひらがな列Xをかな漢字混じり文Yへ変換する仮名漢字変換については、単語の読み方とその表記の関連性を学習する必要があり、現時点(2024年7月8日)ではLLMでもうまく解くことがで

【LLM】Few-shot推論は言語化の壁を越えられるか

こんにちは。メディア研究開発センターの川畑です。 みなさん ChatGPT 使ってますか?便利ですよね。何か訊いたら大概のことは正確に教えてくれますし、論文等の文書もわかりやすくまとめてくれたりと万能な存在です。 そんな便利な ChatGPT もとい LLM (large language model) ですが、その知識を引き出すためには質問や指示をキチンと言葉にしなければいけません。ちゃんと指示を言葉にする、というのは一見すれば簡単なことですが、何度もチャットしていると

LLMのTraceabilityについて素人が考えてみた

はじめにメディア研究開発センターの村瀬です。よろしくお願いします。 今回のブログはLLMやDeep Learningについて初学者の私がLLMのTraceabilityについて考えてみたという内容でお送りします。 発端 私が急にLLMのTraceabilityについて考え出したのは天啓があったから….ではなく、メディアとしてLLMが生成した物を見極める力が必要ではないかと考えためです。”LLMの生成物の判別”というキーワードで調べていくうちにLLMのTraceabilit

『AIは短歌をどう詠むか』という本

はじめにみなさん、こんにちは。メディア研究開発センター(M研)の浦川です。私は普段、自然言語処理(書き言葉から話し言葉まで、日常生活で普通にヒトが使う言葉をコンピュータで扱うこと)に関する研究開発に従事しています。これまでに、自動で記事の見出しを生成する「TSUNA」や、短歌を生成する「短歌AI」などに携わってきました。 さて、本日は6月20日に講談社現代新書として発売される『AIは短歌をどう詠むか』という本についてご紹介します。 こんな本です本書は、〈短歌AI〉が短歌を

【Presented by AWS Japan】 DynamoDB勉強会を開催してもらいました

こんにちは!朝日新聞社メディア研究開発センターの嘉田です。 今回は、先日AWSさんに開催していただいたDynamoDB勉強会についてご紹介します。 経緯弊センターではAWSを使って様々なプロダクトを開発しています。 私が研究開発に携わっている社内向け音声書き起こしシステムもAWSをフル活用しており、AWSのソリューションアーキテクトや営業の方々には日頃からお世話になっています。 過去には音声書き起こしシステムについてAWSブログやオンラインセミナーなどでご紹介させていただき

LLMは本当になんでも得意なの?TSUNAの文字数コントロールを検証

朝日新聞社メディア研究開発センター 田森です。 ゴールデンウィークがいよいよ始まりますね。メディア研究開発センターも4月には新年度を迎えワチャワチャしていましたが、月末になりようやく落ち着きを見せてきました。 ようやく、ようやく、要約。ということで、今回のテックブログは自然言語処理における要約タスクとLLMの最近について書いてみたいと思います。このブログは、NLP2024のワークショップ「生成AI時代の自然言語処理における産学官の役割と課題」で発表するにあたり、調査した内

SAR衛星画像で能登半島地震の被災状況を把握する初めてのトライ

はじめに地震や、台風などの自然災害が発生した時に、一番重要なのは被害状況を迅速に把握することです。それによって、迅速かつ適切な救援や、復旧、生活再建活動を行うことができます。災害地の状況を迅速に把握するために、衛星画像を解析した結果を利用することができます。 朝日新聞社メディア研究開発センターの福沢です。令和6年1月1日16時10分に、日本の石川県の能登半島地下16kmで発生した最大震度7の内陸地殻内地震で、建物の倒壊や津波の被害、それに地盤の隆起、火災の被害などが発生しま