2025/2/22-2/28 AIに関するニュースと論文で気になったもの

こんにちは。この記事では2025年2月22日〜28日に見つけたAI関連のニュースや論文の中で、特に気になったものをピックアップして紹介します。

※紹介する中には、必ずしも上記期間内に発表されたものではない情報も含まれます。

目次

新規LLMが続々登場(GPT-4.5、Claude3.7など)

今週の主なリリース

  • OpenAIのGPT-4.5
  • AnthropicのClaude3.7
  • GoogleのGemini-2.0-Flash-Lite(GA発表)
  • xAIのGrok 3
  • IBMのGranite 3.2
  • MicrosoftのPhi-4-multimodal & mini
  • AlibabaのWan 2.1

今週は新しいLLMの発表が非常に多く、情報を追うだけでも一苦労でしたね。

3つのトレンドを感じました

  1. 性能特化型(GPT-4.5、Claude3.7)
    性能は非常に高いが、利用コストも高め。AIエージェントのようにAI中心の価値提供に向いています。
  2. 軽量・安定性重視型(Gemini-2.0-Flash-Lite、Phi-4)
    性能を一定以上保ちつつ軽量で安定性も高く、コストパフォーマンスに優れています。複数機能を統合するシステムに向いています。
  3. オープンソース型(Granite 3.2、Wan 2.1)
    自社サーバーなど自由な環境で使えるため、自由度・安定性の面でメリットがあります。

機能的には①が面白いのですが、実務的には②や③が重要になると思っています。今後の進化が楽しみですね。

新たなコーディングエージェントの登場

主な新サービス

Claude Codeは、ターミナル上でコードの検索・編集・テスト・GitHubへのコミットなどが可能な対話型エージェントです。コードベース全体を自然言語で操作し、開発フローを部分的に自動化できるのが特徴で、単なる補完ツールを超えた「開発の相棒」的な存在になりそうです。

Gemini Code Assistは、VSCodeやJetBrains IDEで使える無料のコード生成アシスタントです。無料版ながら1日あたりコード関連リクエスト6,000件+チャット240件まで利用可能で、入力可能なコンテキストが最大128,000トークンと極めて大きく、Googleらしい太っ腹なサービスです。

AI×コーディング領域はCursorなども急成長しており、今後の競争・進化が楽しみな分野です。

Towards an AI Co-Scientist

Googleが発表したGemini 2.0ベースのマルチエージェントシステムです。研究者のパートナーとして仮説生成・討論・進化を行い、新たな知見を生み出すことを目的としています。

特徴

  • 複数エージェントが仮説を生成→評価→トーナメント式で進化させる。
  • バイオ医療分野での有効性を実証済み(例:肝線維症治療の新分子標的の発見)。

今後は汎用科学領域への応用や、計算資源の最適化が課題になりそうです。

中国発オープンソース推論モデル「Open-Reasoner-Zero」

中国の研究チームが開発した推論特化型の強化学習フレームワークです。ベースはQwen-2.5で、OpenRLHF・DeepSpeedなど最新技術を活用しています。

特徴

  • 従来の1/30の学習ステップで最先端モデル(DeepSeek-R1-Zero)と同等性能を達成
  • 完全オープンソースで公開、高品質データ・モデルも利用可能

今後の課題は、大規模モデルへの適用やマルチモーダル対応、そして再現性向上です。

私の感想・注目したポイント

  • 新たなLLMが続々発表され、まさに群雄割拠と感じました。
  • AIエージェント系やオープンソースの進展が特に興味深かったです。実務目線では軽量で安定したAIやオープンソースが重要だと思います。
  • AI Co-Scientistのような先進的な研究が論文ベースで迅速に公開されるのはとても勉強になります。
  • 中国コミュニティの透明性や公開性は素晴らしいと思いました。自分でも追試したり活用したいと思える内容でした。

今週も目白押しで、特にエージェント系AIやオープンソースの動きが面白かったですね。次週も引き続き注目していきたいと思います!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次