『OpenAI、新しいAI推論モデル「o3」と「o4-mini」をリリース』
ソースウェブサイト: TechCrunch
リンク: https://techcrunch.com/2025/04/16/openai-launches-a-pair-of-ai-reasoning-models-o3-and-o4-mini/
概要: OpenAIは4月16日、新しいAI推論モデル「o3」と「o4-mini」をリリースしました。これらのモデルは質問に対して「考える」プロセスを経てから回答する設計になっています。o3はOpenAIの最も高度な推論モデルで、数学、コーディング、推論、科学、視覚理解の能力を測るテストで同社の以前のモデルを上回る性能を発揮します。一方、o4-miniは価格、速度、性能のバランスに優れています。両モデルはウェブ検索、Pythonコード実行、画像処理、画像生成などのツールを使用して回答を生成できます。特筆すべき点は「画像と共に考える」能力で、ユーザーはホワイトボードのスケッチやPDFの図表などの画像をアップロードすると、モデルは「思考の連鎖」の段階でそれらを分析します。開発者向けには比較的低価格で提供され、o3は入力トークン100万件あたり10ドル、出力トークン100万件あたり40ドルです。
リンク: https://techcrunch.com/2025/04/16/openai-launches-a-pair-of-ai-reasoning-models-o3-and-o4-mini/
概要: OpenAIは4月16日、新しいAI推論モデル「o3」と「o4-mini」をリリースしました。これらのモデルは質問に対して「考える」プロセスを経てから回答する設計になっています。o3はOpenAIの最も高度な推論モデルで、数学、コーディング、推論、科学、視覚理解の能力を測るテストで同社の以前のモデルを上回る性能を発揮します。一方、o4-miniは価格、速度、性能のバランスに優れています。両モデルはウェブ検索、Pythonコード実行、画像処理、画像生成などのツールを使用して回答を生成できます。特筆すべき点は「画像と共に考える」能力で、ユーザーはホワイトボードのスケッチやPDFの図表などの画像をアップロードすると、モデルは「思考の連鎖」の段階でそれらを分析します。開発者向けには比較的低価格で提供され、o3は入力トークン100万件あたり10ドル、出力トークン100万件あたり40ドルです。
『OpenAI、低優先度タスク向けの低価格「Flex処理」オプションを導入』
ソースウェブサイト: TechCrunch
リンク: https://techcrunch.com/2025/04/17/openai-launches-flex-processing-for-cheaper-slower-ai-tasks/
概要: OpenAIはGoogle等の競合他社に対抗するため、「Flex処理」と呼ばれる新しいAPIオプションを導入しました。これは応答時間が遅くなり「時折リソースが利用できない」ことと引き換えに、AIモデル使用料を削減するサービスです。最近リリースされたo3とo4-mini推論モデル向けにベータ版として提供され、モデル評価やデータ強化など低優先度・非本番環境のタスクを対象としています。Flex処理によりAPIコストは正確に半額になります。o3の場合、通常の入力トークン100万件あたり10ドル、出力トークン100万件あたり40ドルが、Flex処理では入力トークン100万件あたり5ドル、出力トークン100万件あたり20ドルになります。この導入は最先端AIの価格が上昇し続け、競合他社がより安価で効率的な予算志向のモデルをリリースする中での対応策です。
リンク: https://techcrunch.com/2025/04/17/openai-launches-flex-processing-for-cheaper-slower-ai-tasks/
概要: OpenAIはGoogle等の競合他社に対抗するため、「Flex処理」と呼ばれる新しいAPIオプションを導入しました。これは応答時間が遅くなり「時折リソースが利用できない」ことと引き換えに、AIモデル使用料を削減するサービスです。最近リリースされたo3とo4-mini推論モデル向けにベータ版として提供され、モデル評価やデータ強化など低優先度・非本番環境のタスクを対象としています。Flex処理によりAPIコストは正確に半額になります。o3の場合、通常の入力トークン100万件あたり10ドル、出力トークン100万件あたり40ドルが、Flex処理では入力トークン100万件あたり5ドル、出力トークン100万件あたり20ドルになります。この導入は最先端AIの価格が上昇し続け、競合他社がより安価で効率的な予算志向のモデルをリリースする中での対応策です。
『ChatGPTの新機能で「リバース位置検索」が可能に』
ソースウェブサイト: TechCrunch
リンク: https://techcrunch.com/2025/04/17/the-latest-viral-chatgpt-trend-is-doing-reverse-location-search-from-photos/
概要: OpenAIの新モデル「o3」と「o4-mini」のリリースに伴い、ユーザーが写真から撮影場所を特定できる「リバース位置検索」が新たなトレンドとなっています。これらのモデルは画像を分析する能力とウェブ検索機能を組み合わせることで、強力な位置特定ツールとなっています。ユーザーはレストランのメニューや街の風景、建物の外観などの写真をアップロードし、「GeoGuessr」(Googleストリートビューの画像から場所を当てるオンラインゲーム)をプレイするよう指示することで、場所を特定できます。この機能はプライバシー上の懸念を引き起こしており、悪意のある人物がInstagramのストーリーなどをスクリーンショットして、ユーザーの居場所を特定する可能性があります。TechCrunchのテストでは、以前のモデルGPT-4oでも多くの場合同様の結果が得られましたが、o3はGPT-4oが特定できなかった場所を見つけることもありました。ただし、o3も完璧ではなく、場所の特定に失敗するケースもあります。
リンク: https://techcrunch.com/2025/04/17/the-latest-viral-chatgpt-trend-is-doing-reverse-location-search-from-photos/
概要: OpenAIの新モデル「o3」と「o4-mini」のリリースに伴い、ユーザーが写真から撮影場所を特定できる「リバース位置検索」が新たなトレンドとなっています。これらのモデルは画像を分析する能力とウェブ検索機能を組み合わせることで、強力な位置特定ツールとなっています。ユーザーはレストランのメニューや街の風景、建物の外観などの写真をアップロードし、「GeoGuessr」(Googleストリートビューの画像から場所を当てるオンラインゲーム)をプレイするよう指示することで、場所を特定できます。この機能はプライバシー上の懸念を引き起こしており、悪意のある人物がInstagramのストーリーなどをスクリーンショットして、ユーザーの居場所を特定する可能性があります。TechCrunchのテストでは、以前のモデルGPT-4oでも多くの場合同様の結果が得られましたが、o3はGPT-4oが特定できなかった場所を見つけることもありました。ただし、o3も完璧ではなく、場所の特定に失敗するケースもあります。
『OpenAI、ターミナル用コーディングエージェント「Codex CLI」をリリース』
ソースウェブサイト: GitHub
リンク: https://github.com/openai/codex
概要: OpenAIは、ターミナル上で動作する軽量コーディングエージェント「Codex CLI」をオープンソースでリリースしました。このツールはターミナルを主な作業環境とする開発者向けに設計され、ChatGPTレベルの推論能力に加えて、コードの実行、ファイル操作、バージョン管理下での反復作業が可能です。セットアップは簡単で、OpenAI APIキーを設定するだけで利用できます。セキュリティ面では、「Suggest」(デフォルト)、「Auto Edit」、「Full Auto」の3つの自律レベルから選択でき、「Full Auto」モードでもネットワーク接続を無効化し、現在の作業ディレクトリに限定した安全な実行環境で動作します。macOSではApple Seatbelt、LinuxではDockerを使用したサンドボックス化が実装されています。開発者は「codex "Refactor the Dashboard component to React Hooks"」のような自然言語指示を与えるだけで、コードの変更、テスト実行、差分表示などが自動的に行われます。
リンク: https://github.com/openai/codex
概要: OpenAIは、ターミナル上で動作する軽量コーディングエージェント「Codex CLI」をオープンソースでリリースしました。このツールはターミナルを主な作業環境とする開発者向けに設計され、ChatGPTレベルの推論能力に加えて、コードの実行、ファイル操作、バージョン管理下での反復作業が可能です。セットアップは簡単で、OpenAI APIキーを設定するだけで利用できます。セキュリティ面では、「Suggest」(デフォルト)、「Auto Edit」、「Full Auto」の3つの自律レベルから選択でき、「Full Auto」モードでもネットワーク接続を無効化し、現在の作業ディレクトリに限定した安全な実行環境で動作します。macOSではApple Seatbelt、LinuxではDockerを使用したサンドボックス化が実装されています。開発者は「codex "Refactor the Dashboard component to React Hooks"」のような自然言語指示を与えるだけで、コードの変更、テスト実行、差分表示などが自動的に行われます。
『Meta FAIR、人間のような知能を持つAIを目指し5つの主要プロジェクトを発表』
ソースウェブサイト: AI News
リンク: https://www.artificialintelligence-news.com/news/meta-fair-advances-human-like-ai-five-major-releases/
概要: MetaのFundamental AI Research(FAIR)チームは、高度な機械知能(AMI)の実現に向けた5つのプロジェクトを発表しました。これらは主にAIの知覚能力(感覚情報を処理・解釈する能力)の向上に焦点を当てており、言語モデリング、ロボティクス、協調型AIエージェントの進歩も含まれています。主な発表内容は:1)「Perception Encoder」- 様々な画像・動画タスクに優れた大規模ビジョンエンコーダー、2)「Perception Language Model(PLM)」- 複雑な視覚認識タスク向けのオープンで再現可能なビジョン言語モデル、3)「Meta Locate 3D」- ロボットが自然言語クエリに基づいて3D環境内のオブジェクトを正確に特定できるエンドツーエンドモデル、4)「Dynamic Byte Latent Transformer」- 従来のトークン化ベースの言語モデルとは異なり、バイトレベルで動作する8Bパラメータのモデル、5)「Collaborative Reasoner」- 人間や他のAIと効果的に協力できるAIエージェントを作成するためのフレームワーク。これらのリリースは、Metaが人間のような方法で世界を知覚、理解、相互作用できる機械の構築に向けた基礎研究に引き続き大きく投資していることを示しています。
リンク: https://www.artificialintelligence-news.com/news/meta-fair-advances-human-like-ai-five-major-releases/
概要: MetaのFundamental AI Research(FAIR)チームは、高度な機械知能(AMI)の実現に向けた5つのプロジェクトを発表しました。これらは主にAIの知覚能力(感覚情報を処理・解釈する能力)の向上に焦点を当てており、言語モデリング、ロボティクス、協調型AIエージェントの進歩も含まれています。主な発表内容は:1)「Perception Encoder」- 様々な画像・動画タスクに優れた大規模ビジョンエンコーダー、2)「Perception Language Model(PLM)」- 複雑な視覚認識タスク向けのオープンで再現可能なビジョン言語モデル、3)「Meta Locate 3D」- ロボットが自然言語クエリに基づいて3D環境内のオブジェクトを正確に特定できるエンドツーエンドモデル、4)「Dynamic Byte Latent Transformer」- 従来のトークン化ベースの言語モデルとは異なり、バイトレベルで動作する8Bパラメータのモデル、5)「Collaborative Reasoner」- 人間や他のAIと効果的に協力できるAIエージェントを作成するためのフレームワーク。これらのリリースは、Metaが人間のような方法で世界を知覚、理解、相互作用できる機械の構築に向けた基礎研究に引き続き大きく投資していることを示しています。
『Huaweiの画期的なAIハードウェアがNVIDIAの優位性に挑戦』
ソースウェブサイト: AI News
リンク: https://www.artificialintelligence-news.com/news/huawei-ai-hardware-breakthrough-challenges-nvidia-dominance/
概要: 中国のテクノロジー大手Huaweiは、グローバルAIチップ競争の勢力図を変える可能性のある「CloudMatrix 384 Supernode」と呼ばれる強力な新しいコンピューティングシステムを発表しました。現地メディアの報道によると、このシステムは米国チップリーダーNVIDIAの類似技術よりも優れたパフォーマンスを発揮するとされています。CloudMatrix 384 Supernodeは300ペタフロップスの計算能力を達成し、NVIDIAのNVL72システムが提供する180ペタフロップスを上回ります。このシステムはAIモデルの大規模化と複雑化に伴い問題となっているコンピューティングのボトルネックに対処するために特別に設計されました。この成果が特に注目に値するのは、Huaweiが米国のエンティティリストに掲載されて以来、厳しい技術的制限に直面してきたにもかかわらず達成されたという点です。制裁によりHuaweiは先進的な米国の半導体技術や設計ソフトウェアへのアクセスが制限され、代替アプローチの開発と国内サプライチェーンへの依存を余儀なくされていました。
リンク: https://www.artificialintelligence-news.com/news/huawei-ai-hardware-breakthrough-challenges-nvidia-dominance/
概要: 中国のテクノロジー大手Huaweiは、グローバルAIチップ競争の勢力図を変える可能性のある「CloudMatrix 384 Supernode」と呼ばれる強力な新しいコンピューティングシステムを発表しました。現地メディアの報道によると、このシステムは米国チップリーダーNVIDIAの類似技術よりも優れたパフォーマンスを発揮するとされています。CloudMatrix 384 Supernodeは300ペタフロップスの計算能力を達成し、NVIDIAのNVL72システムが提供する180ペタフロップスを上回ります。このシステムはAIモデルの大規模化と複雑化に伴い問題となっているコンピューティングのボトルネックに対処するために特別に設計されました。この成果が特に注目に値するのは、Huaweiが米国のエンティティリストに掲載されて以来、厳しい技術的制限に直面してきたにもかかわらず達成されたという点です。制裁によりHuaweiは先進的な米国の半導体技術や設計ソフトウェアへのアクセスが制限され、代替アプローチの開発と国内サプライチェーンへの依存を余儀なくされていました。
以上が最新のAI関連ニュースのまとめです。AIの推論能力の向上、低コスト化への取り組み、プライバシー問題の出現、開発者ツールの進化、そして国際的な技術競争の激化など、AIの急速な発展と多様な影響が見られます。
#AI最新ニュース要約
(ライター/Felo君)
■Kishioka Design Blog
■Kishioka-Design日誌(はてなブログ)
■note