こんにちは。この記事では2025年2月22日〜28日に見つけたAI関連のニュースや論文の中で、特に気になったものをピックアップして紹介します。
※紹介する中には、必ずしも上記期間内に発表されたものではない情報も含まれます。
新規LLMが続々登場(GPT-4.5、Claude3.7など)
今週の主なリリース
- OpenAIのGPT-4.5
- AnthropicのClaude3.7
- GoogleのGemini-2.0-Flash-Lite(GA発表)
- xAIのGrok 3
- IBMのGranite 3.2
- MicrosoftのPhi-4-multimodal & mini
- AlibabaのWan 2.1
今週は新しいLLMの発表が非常に多く、情報を追うだけでも一苦労でしたね。
3つのトレンドを感じました
- 性能特化型(GPT-4.5、Claude3.7)
性能は非常に高いが、利用コストも高め。AIエージェントのようにAI中心の価値提供に向いています。 - 軽量・安定性重視型(Gemini-2.0-Flash-Lite、Phi-4)
性能を一定以上保ちつつ軽量で安定性も高く、コストパフォーマンスに優れています。複数機能を統合するシステムに向いています。 - オープンソース型(Granite 3.2、Wan 2.1)
自社サーバーなど自由な環境で使えるため、自由度・安定性の面でメリットがあります。
機能的には①が面白いのですが、実務的には②や③が重要になると思っています。今後の進化が楽しみですね。
新たなコーディングエージェントの登場
主な新サービス
Claude Codeは、ターミナル上でコードの検索・編集・テスト・GitHubへのコミットなどが可能な対話型エージェントです。コードベース全体を自然言語で操作し、開発フローを部分的に自動化できるのが特徴で、単なる補完ツールを超えた「開発の相棒」的な存在になりそうです。
Gemini Code Assistは、VSCodeやJetBrains IDEで使える無料のコード生成アシスタントです。無料版ながら1日あたりコード関連リクエスト6,000件+チャット240件まで利用可能で、入力可能なコンテキストが最大128,000トークンと極めて大きく、Googleらしい太っ腹なサービスです。
AI×コーディング領域はCursorなども急成長しており、今後の競争・進化が楽しみな分野です。
Towards an AI Co-Scientist
Googleが発表したGemini 2.0ベースのマルチエージェントシステムです。研究者のパートナーとして仮説生成・討論・進化を行い、新たな知見を生み出すことを目的としています。
特徴
- 複数エージェントが仮説を生成→評価→トーナメント式で進化させる。
- バイオ医療分野での有効性を実証済み(例:肝線維症治療の新分子標的の発見)。
今後は汎用科学領域への応用や、計算資源の最適化が課題になりそうです。
中国発オープンソース推論モデル「Open-Reasoner-Zero」
中国の研究チームが開発した推論特化型の強化学習フレームワークです。ベースはQwen-2.5で、OpenRLHF・DeepSpeedなど最新技術を活用しています。
特徴
- 従来の1/30の学習ステップで最先端モデル(DeepSeek-R1-Zero)と同等性能を達成
- 完全オープンソースで公開、高品質データ・モデルも利用可能
今後の課題は、大規模モデルへの適用やマルチモーダル対応、そして再現性向上です。
私の感想・注目したポイント
- 新たなLLMが続々発表され、まさに群雄割拠と感じました。
- AIエージェント系やオープンソースの進展が特に興味深かったです。実務目線では軽量で安定したAIやオープンソースが重要だと思います。
- AI Co-Scientistのような先進的な研究が論文ベースで迅速に公開されるのはとても勉強になります。
- 中国コミュニティの透明性や公開性は素晴らしいと思いました。自分でも追試したり活用したいと思える内容でした。
今週も目白押しで、特にエージェント系AIやオープンソースの動きが面白かったですね。次週も引き続き注目していきたいと思います!