おい、HN!私たちは Aakash と Viswesh で、Canary (https://www.runcanary.ai) を構築しています。私たちは、コードベースを読み取り、プル リクエストが実際に何を変更したかを把握し、影響を受けるすべてのユーザー ワークフローのテストを生成して実行する AI エージェントを構築します。Aakash と私は、以前に Windsurf、Cognition、Google で AI コーディング ツールを構築しました。 AI ツールのおかげで、各チームの出荷作業は迅速化されましたが、マージ前に実際のユーザーの行動をテストする人は誰もいませんでした。 PR は...
今日のAIニュースを、意味が分かる順番でまとめています。
「スコア 10.0」「信頼度 50/100」のような内部数値は見せず、見逃せない、チェック推奨、参考メモ の3段階で整理しています。
表示中の記事数
ビジネス
ツール
SNS / 論文
このページの見方
並び順は「影響の大きさ」と「新しさ」をもとに自動で決めています。まず上から見れば、大きな話題を追えます。
一次情報や主要メディアは上位に来やすくなります
公式発表、大型リリース、資金調達、研究成果など、影響が大きい話題です。
今日の動向を追うなら押さえたい更新です。実用的な新機能や業界トピックが入ります。
個人投稿や補足情報など、背景理解や現場感をつかむための話題です。
OpenAI がどのように思考連鎖モニタリングを使用して内部コーディング エージェントの不整合を研究し、現実世界の展開を分析してリスクを検出し、AI の安全保護を強化するのか。
OpenAI、Meta、DeepSeek、Mistral AI などの主要な AI ラボからのモデルを圧縮した後、Multiverse Computing は、圧縮モデルの機能を紹介するアプリと、圧縮モデルをより広く利用できるようにする API の両方をリリースしました。
SageMaker AI エンドポイントは、公開頻度を構成できる強化されたメトリクスをサポートするようになりました。このリリースにより、運用エンドポイントの監視、トラブルシューティング、改善に必要な詳細な可視性が提供されます。
人工知能はトークン駆動型です。すべてのプロンプト、推論ステップ、およびエージェントの対話によってトークンが生成されます。過去 1 年間でトークンの消費量は増加しました...
AI は、指示に従うアシスタントから、独立して行動するエージェントへと進化しました。爪と呼ばれるこれらのエージェントは、目標を達成し、それを達成する方法を見つけることができます...
Codex の成長を加速して次世代の Python 開発者ツールを強化
記事URL: https://github.com/anomalyco/opencode/pull/18186 コメントURL:https://news.ycombinator.com/item?id=47444748 ポイント: 289 # コメント数: 248
MITの研究者らは、ロボットが隠れた物体を「見る」ことで見つけて操作できるようにする技術の研究に10年以上を費やしてきた。障害物を通って。彼らの手法は、隠されたアイテムに反射する表面透過無線信号を利用します。現在、研究者らは生成人工知能モデルを活用して、以前のアプローチの精度を制限していた長年のボトルネックを克服しています。その結果、より正確な形状の再構成を生成する新しい方法が誕生し、視界から遮られた物体を確実に把握して操作するロボットの能力が向上する可能性があります。この新しい技術は、反射された無線信号から隠されたオブジェクトの部分的な再構成を構築し、特別にトレーニングされた生成 AI モデ...
arXiv には、現実世界に影響を与える AI セキュリティ研究が多数公開されていますが、そのほとんどは他の研究者向けに書かれています。私たちは、これらの論文を専門家や AI の安全性に関心のある人が実際に使用できるものに翻訳する、隔週のダイジェストを開始しました。各論文には、4 つの側面 (脅威の現実性、防衛の緊急性、新規性、研究の成熟度) にわたる構造化された評価と、Act Now (差し迫った現実的な懸念)、Watch (監視すべき新たな技術)、または Horizon (長期的な研究傾向) のバッジが与えられます。 **最初の号のハイライト:** **カスケード -- 「攻撃者が A...
NVIDIA Groq 3 LPX は、NVIDIA Vera Rubin プラットフォーム用の新しいラックスケール推論アクセラレータであり、低レイテンシーとラージコンテキストの要求に合わせて設計されています。
この投稿では、Amazon Quick Microsoft Teams 拡張機能を複数の AWS リージョンにデプロイするときにデータ常駐を強制する方法を説明します。ユーザーを AWS リージョンに適したリソースに自動的にルーティングし、GDPR やその他のデータ主権要件へのコンプライアンスを維持するのに役立つマルチリージョン Amazon Quick 拡張機能を設定する方法を学びます。
OpenAIのソフトウェア開発チームは「ハーネスエンジニアリング」を実践し、同社のAIコーディングエージェント「Codex」を活用して、手作業のコーディングなしで社内向けソフトウェアを開発したという。公式ブログで取り組みの成果と課題を共有した。
この投稿では、自然言語のテキスト プロンプトと画像を根拠のある高品質のビデオに変換する、VRAG を介したビデオ生成へのアプローチを探ります。この完全に自動化されたソリューションを通じて、構造化テキストと画像入力からリアルな AI を活用したビデオ シーケンスを生成し、ビデオ作成プロセスを合理化できます。
UCLA 環境持続可能性研究所の研究者らは、これまでで最も高解像度のカリフォルニアのケルプ森林の州全体の地図を開発しました。これにより、研究者、自然保護活動家、コミュニティのメンバーは、沿岸の生態系と彼らが支援するコミュニティの維持に不可欠な情報にこれまでにないアクセスが可能になります。 AI ディープラーニングを Planet の Dove 衛星群に適用することで、チームは以前の標準的な衛星記録よりも 10 倍詳細な地図を作成し、カリフォルニアの海岸線に沿った昆布の状態と保護活動の成功を監視するためのより正確な方法を提供しました。 「特に昆布がまばらな地域では、実験的修復技術の有効性を評価し...
この投稿では、Nemotron 3 Super モデルの技術的特徴を調査し、潜在的なアプリケーションの使用例について説明します。また、Amazon Bedrock 環境内で生成 AI アプリケーションにこのモデルの使用を開始するための技術的なガイダンスも提供します。
企業の情報システム部門が「Microsoft 365」「Microsoft 365 Copilot」を社内で有効活用するためのノウハウを解説する本連載。今回は、ユーザーが効果的にAI(Microsoft 365 Copilot)にアシストしてもらうには何が大事なのかを解説します。
心臓病は世界中の成人死亡の主な原因であり、心血管疾患の診断と管理は世界的な健康上の優先事項となっています。心エコー図、つまり心臓超音波検査は、さまざまな心臓の病気や状態を診断するために医師が使用する最も一般的に使用される画像ツールの 1 つです。ほとんどの標準的な心エコー図は、三次元 (3D) 心臓の解剖学的構造の二次元視覚画像 (2D) を提供します。これらの心エコー図では、鼓動する心臓の何百もの 2D スライスまたはビューがキャプチャされることが多く、これにより医師は心臓の機能と構造について臨床評価を行うことができます。心臓病の診断精度を向上させるため、カリフォルニア大学サンフランシスコ校...
この論文では、現在の AI の限界を批判し、生物学的な脳にヒントを得た新しい学習モデルを紹介します。著者らは、見ることで学習するシステム A と実行して学習するシステム B という 2 つの主要な方法を組み合わせたフレームワークを提案しています。これらを管理するために、状況に応じてどの学習スタイルを使用するかを決定する制御ユニットである System M が含まれています。著者らは、動物や人間が時間の経過とともに現実世界に適応する様子を模倣することで、より独立して学習できる AI を作成することを目指しています。  によって送信されました   /u/ViKKed [リンク]...
この投稿では、ビデオ コンテンツの作成を改善するためのアプローチである Video Retrieval-Augmented Generation (V-RAG) を紹介します。 V-RAG は、検索拡張生成と高度なビデオ AI モデルを組み合わせることで、AI ビデオを生成するための効率的で信頼性の高いソリューションを提供します。
私は、arXiv から AI セキュリティに関する論文を取得し、実践者向けのインテリジェンスに変換する隔週のダイジェストを作成してきました。各論文は、脅威の現実性、防御の緊急性、新規性、研究の成熟度 (1 ~ 5 段階) の 4 つの側面で評価され、防御側がどれだけ迅速に対応する必要があるかに基づいて、「今すぐ行動」/「監視」/「水平線」に分類されます。最初の号では 3 つの論文を取り上げます。 **Cascade (arXiv:2603.12023) -- Act Now** 複合 AI システムに対するハードウェア レベルのエクスプロイト (Rowhammer) を使用してソフトウェア C...
Agent Builder はフリートになりました。これは、すべてのチームが企業全体でエージェントを構築、使用、管理するための中心的な場所です。
皆さん、私は小規模な ML プロジェクト (約 1200 サンプル) に取り組んでおり、以下を予測しようとしています: 感情状態 (分類 — 6 クラス) その感情の強度 (1 ~ 5) データセットには以下が含まれます: ジャーナルテキスト (短く、騒がしい反射) 次のようなメタデータ: ストレスレベル エネルギーレベル 睡眠時間 前日の時刻 前日の気分 雰囲気タイプ 顔感情ヒント 継続時間最小反射品質🔧 これまでにやったこと 1. TF-IDF を使用したテキスト処理: max_features = 500 → 1000+ も試してみた ngram_range = (1,2) stop_w...
こんにちは、みんな!このフォーラムの初心者です。私は量子研究の役割のために複数の場所で面接を受け、数学/物理学を勉強する新卒として積極的に就職活動を行っています。私はディープマインドの可能性を見出しました。これは、物理数学と ML が交わる点で、私がこれまで見た中で最も興味深い役割の 1 つと思われます。彼らから面接を受けるのはどれくらい難しいですか?私がこれまでに応募したのは、Anthropic のフェローであったもう 1 つの ML の役割だけで、OA 後はあまり進められませんでした。  によって送信されました   /u/n0obmaster699 [リンク]  ...
**SPEED-Bench のご紹介: 投機的デコーディングのための統合された多様なベンチマーク**
誰もが <a href="https://machinelearningmastery.
Googleは3月18日、Gemini搭載のUIデザイン・コード生成ツール「Stitch」を刷新し、「Vibe Design with Stitch」を発表。AIネイティブなキャンバス上で、テキスト、画像、音声コマンドを用いてUIデザインやアプリ開発を支援する。
言語モデリングは基本的にトークンレベルですか、それともシーケンスレベルですか?両方の証拠があります。事前トレーニングとサンプリングはトークン レベルのビューに偏っていますが、アライメントは基本的にシーケンス レベルです。 2 つの視点を統一しようとしている作品があるかどうか、そしてどちらがより原則的な枠組みであるかについて興味があります。教科書の言語モデリングの事前トレーニングでは、タスクを文字列上の分布の学習として定義していますが、私がこれまでに見たクロスエントロピー損失の実装はすべてトークン レベルで動作します。違いは微妙ですが現実的です。両方とも、バッチ内のすべてのトークンに対する -l...
経営者は全員読んだ方がいい。 https://t.co/GrXVIV3dzo
音声入力アプリ?もう半年近くWhisper APIをiOSショートカットで直叩きのストロングスタイルよ。 GPTで後処理も入れてるから、翻訳、箇条書き、文章修正も自分好みに。iPhone、Apple Watch、Mac Bookで呼び出せて,値段も月数百円くらい 【コスパ最強AI文字起こし】Apple Watch +
Typelessが問題あるのかは不明ですが、ユーザー体験はかなり良さそうだなぁって思っていました。 ちなみに自作のHootVoiceならローカルで文字起こし -> ローカルでLLM変換できます。無料&OSSでコードも公開されています。Win/Mac/Linux対応です。 https://t.co/B8yuML2JM9 https://t.co/niIsQIw21M
Typelessを紹介している動画で、 Typelessとは とか調べて紹介しているのなら、 すぐに懸念があることくらいわかるはず。 それで多くのフォロワー向けに紹介しててかなりタチが悪いと思いますね @masahirochaen https://t.co/S8eN2COyaQ
高橋恒一先生 @ktakahashi74 との共著論文(https://t.co/wItYaZtdAc)の解説記事を公開しました。物理現象と情報処理の間にある「隠れた会計学」を考慮しよう,という提案です。 https://t.co/wzYXrHjv0V https://t.co/keZruv94lz
 によって送信されました   /u/Full_Double_1748 [リンク]   [コメント]
GlobantとPharmaMarは、がん治療薬の発見を加速させるマルチエージェントAIプラットフォームを共同開発。R&Dにおけるデータ分析を最大15倍高速化し、90%以上の精度で有望な治療法を特定する。
NVIDIAはGTC 2026にて、通信事業者のネットワーク網を活用し、エッジ側でAI推論を実行・収益化する「AI Grid」構想を発表。AT&TやSpectrumなど主要キャリアが導入を開始している。
ほとんどの AI 推論の最適化は、逐次プロセスを高速化することに重点を置いています。私は別の方向に進みました。逐次依存関係を完全に排除したらどうなるでしょうか?私は、意図の計算と並列表現を分離する 2 層アーキテクチャである ILPG (Latent Intention Parallel Generation) を開発しました。このシステムは、単一パスで応答の完全なブループリントを生成し、その式を複数の同時かつ独立したプロセスに分散します。各プロセスは、他のプロセスの出力に依存するのではなく、共有されたインテント ベクトルに基づいて条件付けされます。これがトランスフォーマーとの根本的な違いです...
そこで、DeepSeek v3.2 の出力が市販のテキスト分類システムとどのように比較されるかを理解するための簡単な実験を行います。ネタバレ注意:違いは非常に大きいです。どれほど巨大なのか知りたいですか?続きを読んで調べてください。 最近の DeepSeek v3.2 リリースは、推論や知識ベースのタスクを含む (ただしこれらに限定されない) 幅広いアプリケーションで人間レベルに近いパフォーマンスをもたらしました。テキスト分類分野における現在の最先端モデルをより深く理解するために、次の実験を実行しました。 方法論: • DeepSeek v3.2 によって独占的に生成された 72 個の長い...