Hello everyone, this will be a bit of a long read, i have a lot of context to provide so i can paint the full picture of what I’m asking, but i’ll be as concise as possible. i want to start this off by saying that I’m not an AI coder or engineer, or technician, whatever you call yourselves, point is...
今日のAIニュースを、重要度順に5分で把握。
内部スコアは非表示。見逃せない・チェック推奨・参考メモの3段階で、上から読むだけで大きな話題を追えます。
重要度の見方
公式発表・大型リリース・資金調達・研究成果など、業界に大きな影響がある話題。
今日の動向を追うなら押さえたい更新。実用的な新機能や業界トピックが中心。
個人投稿や補足情報。背景理解や現場感をつかむための話題。
急速に進歩する材料科学の分野では、革新的な研究の方向性を明らかにできるかどうかは、多くの場合、膨大な量の複雑なデータを処理して解釈する能力にかかっています。画期的な学際的な取り組みとして、研究者らは概念グラフと組み合わせた大規模言語モデル (LLM) の力を利用して、材料研究における新たな経路を予測するだけでなく解明することもできました。 Marwitzらの最近の出版物で報告されたこの新しい方法論の相乗効果は、科学的知識がどのように生成され、どのようにナビゲートされるかにおける大きな進歩を表しており、現代技術の最も重要な領域の1つにおける発見を加速することが期待されています。科学的調査への人工...
The San Francisco Standard の新しいレポートでは、カリフォルニア州で AI 年齢認証法案を推進する団体である Parents and Kids Safe AI Coalition が OpenAI によって全額資金提供されていたことが明らかになりました。連合に参加した児童の安全擁護活動家や非営利団体は、グループ発足後までテクノロジー大手の資金援助について全く知らなかったと述べており、メンバーの一人はこの秘密の取り決めは非常に不愉快な気分だったと述べた。  によって送信されました   /u/EchoOfOppenheimer [リンク]   ...
 によって送信されました   /u/scientificamerican [リンク]   [コメント]
財務モデリングに chatgpt を推奨している人を頻繁に見かけますが、私はこれを撤回する必要があります。なぜなら、私は多世帯保険引受向けに 1 か月かけてテストしましたが、結果は使用できるものには程遠いものでした。レントロール、T12、運用明細書を貼り付け、モデルの構築を依頼すると、フラグメントが得られます。いくつかの計算式、キャッシュ フロー テーブル、おそらくキャップ レートの計算。投資委員会に提出できるワークブックに結びつくものはありません。 15 回のプロンプトの後、Excel で作成するのと同じ時間を費やしましたが、セル D47 で幻覚を起こした chatgpt をデバッグする必要...
アントロピック社の幹部らは、これは事故だったと主張し、削除通知の大部分を撤回した。
OpenAI は、AI に関する世界的な会話を加速し、独立メディアをサポートして、建設業者、企業、およびより広範なテクノロジー コミュニティとの対話を拡大するために TBPN を買収します。
記事URL:https://deepmind.google/models/gemma/gemma-4/ コメントURL:https://news.ycombinator.com/item?id=47616361 ポイント: 930 # コメント数: 283
Rocket Close は、AWS Generative AI Innovation Center (GenAIIC) との戦略的パートナーシップを通じて、処理時間を大幅に短縮し、プロセスを 15 倍高速化するインテリジェントなドキュメント処理ソリューションを開発しました。このソリューションは、OCR 処理に Amazon Textract を使用し、基礎モデル (FM) に Amazon Bedrock を使用し、ドキュメントのセグメンテーション、分類、フィールド抽出において全体で 90% という高い精度を達成しています。
この投稿では、TGS が Amazon SageMaker HyperPod を使用して、分散トレーニングのほぼ線形のスケーリングと Vision Transformer ベースの SFM のコンテキストウィンドウの拡張をどのように達成したかについて説明します。この共同ソリューションにより、訓練時間が 6 か月からわずか 5 日間に短縮され、同時にこれまで可能であったよりも大きな地震ボリュームの解析が可能になりました。
新しい AI モデルは、Microsoft が開発した AI システムへのさらなる推進を示しています。
ビジョン AI システムでは、モデルのスループットが向上し続けています。デコード、前処理、GPU など、周囲のパイプライン ステージも歩調を合わせる必要があります。
別のチャットボットサービスからメモリをインポートする機能はClaudeが先行していましたが、Geminiにもメモリインポート機能がやってきました。しかも、チャット履歴のインポートもサポートされています。果たしてこれがどんなものなのか。さっそく試してみました。
私は MCP を使用しません。間違っていることを証明してください。誤解しないでください。たとえば、クラウド コード Chrome 拡張機能が勝者であり、ローカル vs コード IDE MCP の除外、vscode 診断などを使用して実行するケースが本当にたくさんあります。私はマルチエージェントOSを構築していて、マルチエージェントワークフローと一般的なシステムにmcpsを統合しようとしていますが、通常は機能せず、コンテキストコストがかかるだけで、コストに見合う価値がありません。数分の一のコストでそれを実行するための特定のツールを作成できる場合、特にこれらのツールやシステムの多くが純粋なコードか...
Gemmaverse は、最新の Gemma 4 マルチモーダルおよび多言語モデルの発売により拡張され、導入の全範囲にわたって拡張できるように設計されています。
Amazon Threat Intelligenceは、商用生成AIサービスを悪用した脅威アクターが「FortiGate」デバイスを大規模に侵害した事例を観測した。侵入された要因は機器の脆弱性ではないという。
生物学において、欠陥は一般的に悪いものです。しかし、材料科学では、欠陥を意図的に調整して、材料に有用な新しい特性を与えることができます。現在、原子スケールの欠陥は、鉄鋼、半導体、太陽電池などの製品の製造プロセス中に慎重に導入され、強度の向上、導電率の制御、性能の最適化などに役立っています。しかし、欠陥が強力なツールになったとはいえ、特に最終材料を切り開いたり損傷したりすることなく、最終製品中のさまざまな種類の欠陥とその濃度を正確に測定することは困難でした。エンジニアは、材料にどのような欠陥があるのかを知らずに、性能が低下したり、意図しない特性を持つ製品を作ってしまう危険があります。今回、M...
手に負えなくなったサイドプロジェクト。これは、~/.claude/ ディレクトリをスキャンし、すべてを TNG LCARS インターフェイスとしてレンダリングする Claude Code のダッシュボードです。スキル、エージェント、フック、MCP サーバー、メモリ ファイルはすべて、完全なコンテンツを表示する詳細パネルでクリック可能です。ライブ モードでは、クロードと会話し、船のコンピューターとして応答するコンピューター バーがあります。音声出力、合成された LCARS サウンドエフェクト、ブートシーケンス、オフライン時のレッドアラート。 Continuum からの Q は、セットアップをロー...
 によって送信されました   /u/Crazy-Car-5186 [リンク]   [コメント]
漏洩したソースコードをダウンロードできた人はいますか?見つかりませんでした。持っている人がいたら、連絡してください。  によって送信されました   /u/No_ Theory_7040 [リンク]   [コメント]
Optuna と Optuna を比較する実験を行いました。自動調査。自動リサーチはより速く収束し、コスト効率が高く、さらにより適切に一般化します。 実験は NanoChat で行われました。Claude に Optuna の検索空間を定義させて、メソッド間の事前分布を調整しました。両方の最適化メソッドを 3 回実行しました。自動リサーチは平均してサンプル効率がはるかに優れています。5 分間のトレーニング設定では、LLM トークンのコストは GPU と同じですが、ステップごとのコストが 2 倍高いにもかかわらず、すべてのコスト予算にわたって AutoResearch が依然として優れています...
皆さん、私たちは現在、純粋に決定論的なコンピューター ビジョン アプローチを使用して、極端な大気の干渉 (スモッグ、大雨、濁った水) を数学的に除去する iOS 用のリアルタイム カメラ エンジンの開発に取り組んでいます。現在、CPU 上でローカルに 1080p 30fps で実行され、遅延ゼロおよび高いエッジ保持が実現されています。現在、オプションの ML ベースのエンジン切り替えの実装を検討しています。目標は、量子化モデル (例: CoreML を介した軽量 U-Net または MobileNet) が、通常オンデバイス推論に伴う大幅なバッテリー消耗や FPS 低下を引き起こすことなく、著...
Google DeepMind は本日 Gemma 4 をリリースしました: Gemma 4 31B: 高密度、256K コンテキスト、効率性と長いコンテキスト品質をターゲットに再設計されたアーキテクチャ Gemma 4 26B A4B: MoE、合計 26B / フォワード パスあたり 4B アクティブ、256K コンテキスト どちらもネイティブ マルチモーダル (テキスト、画像、ビデオ、動的解像度) です。発売日には、同じスタックの NVIDIA B200 と AMD MI355X の両方を MAX で実行できました。 B200 では、vLLM と比較して出力スループットが 15% 向上し...
💡TL;DR: GLM-5 や MiniMax M2.7 などのオープン モデルが、コア エージェント タスクでクローズド フロンティア モデルと一致するようになりました —ファイル操作、ツールの使用、および次の指示わずかなコストと待ち時間で実現できます。私たちの eval が示す内容とその使用を開始する方法は次のとおりです
KiloClaw のリリースにより、企業は自律エージェントに対するガバナンスを強化し、シャドウ AI を管理するツールを利用できるようになりました。企業が昨年、大規模な言語モデルの確保とベンダー契約の正式化に費やした一方で、開発者や知識労働者は独自に動き始めました。従業員は公式調達を回避し、個人インフラ上に自律エージェントを配置して、[…] KiloClaw が自律エージェント ガバナンスを備えたシャドウ AI をターゲットにした記事が AI ニュースに最初に掲載されました。
最小二乗法のベクトル表示。 投稿「線形回帰は実際には投影問題である (パート 2: 投影から予測へ)」は、最初に「データ サイエンスに向けて」に掲載されました。
私は昨年、「VLA モデルは実際の商用タスクにおいてどの程度優れているのか?」という単純な質問に答えるために費やしました。デモでもシミュレーションでも、10 回の試行での成功率でもありません。実際のハードウェア上の実際の運用メトリクス。正直な数字がどこにも見つからなかったので、ベンチマークを作成しました。セットアップ: DROID プラットフォーム、箱から箱への注文ピッキング – 最も一般的な倉庫および産業業務の 1 つ。同じ実際のロボット データセットで 4 つのモデルを微調整し、ブラインドで評価しました (オペレーターはどのモデルが実行されているか知りません)。私たちは、人々が実際に使用す...
10年前には、人工知能が現在できることを実現できるとは信じられなかったでしょう。ただし、これと同じ力が、従来のセキュリティ フレームワークが対処するように構築されていなかった新しい攻撃対象領域をもたらします。このテクノロジーが重要な業務に組み込まれるようになるにつれて、企業は多層防御戦略を必要とします […] AI システムを保護するための 5 つのベスト プラクティスの投稿は、AI News に最初に掲載されました。
量子機械学習におけるワークフローとエンコード技術 投稿「量子モデルで古典データを処理する方法」は、最初に「データ サイエンスに向けて」に掲載されました。
Tl;dr: スタンフォードで最も人気のある AI セミナー コースの 1 つ。講座を一般公開しております。講義は明日(木曜日)午後4時30分から5時50分(太平洋夏時間)にスキリング講堂とZoomで始まります。会話は録音されます。コースの Web サイト: https://web.stanford.edu/class/cs25/。世界を席巻した深層学習モデル、トランスフォーマーに興味がありますか?研究者と親密な議論をしてみませんか?もしそうなら、このコースはあなたのためです!毎週、トランスフォーマー研究の最前線にいる人々を招待し、GPT や Gemini などの LLM アーキテクチャから、...
Gemma 4 へようこそ: デバイス上のフロンティア マルチモーダル インテリジェンス
ここに春が来たように感じられ、新しい NVIDIA 統合、Interrupt 2026 のチケット販売、LangSmith Fleet (旧称 Agent Builder) の発表も行われています。
私は小規模データ ML を実験してきましたが、最終的に再帰的注意モデル (TRIADS) を構築することにしました。いくつかの結果に私は驚きました: \- 材料タスクで \~44,000 のパラメータ バージョンが 0.964 ROC-AUC に達し、GPTChem (>1B パラメータ) を上回り、複数のマットベンチ タスクで SOTA に近い値を達成 \- 事前トレーニングなし、小規模なデータセット (300 ~ 5,000 サンプル) のみでトレーニング \- 最大の結果: サイクルごとの監視を追加 (アーキテクチャの変更なし) して誤差が \~23% 削減されました 興味深いのは、これ...
私は最初の研究論文を発表したところですが、微調整が実際に何を行うのかを誤解しているようです。 「ブレインスタック: 継続的な LLM 学習のための凍結 MoE-LoRA スタックによるクロスドメイン認知機能」私は、一度に 1 つのドメインごとに、ほとんど忘れることなく、LLM に無制限のドメイン専門知識を追加するアーキテクチャを構築しました。ヌル空間射影は、正則化ではなく線形代数によって強制され、新しい各ドメインを以前のドメインに直交する部分空間に制約します。メタルーターは、推論時にスタックファイアを選択的にゲートします。凍結されたウェイトは変更できません。無関係なスタックは干渉できません。 ...
皆さん、こんにちは。私は入力が構造化されたイベントのシーケンスであり、各イベントに複数の異種の特徴が含まれるシーケンス モデリングの設定に取り組んでいます。各タイムステップは 1 つのイベント (トークン) に対応し、完全なシーケンスにはそのようなイベントが約 10 ~ 30 個含まれる場合があります。各イベントには次の組み合わせが含まれます。 - カテゴリ フィールド (タイプ、位置、カテゴリなど) - マルチホット属性 (特徴のセット) - 数値または集計された概要 - シーケンス内の関連要素への参照 --- ### セットアップ シーケンス全体は Transformer でエンコードされ...
Google ResearchがAI処理におけるメモリ圧縮のブレイクスルーを発表。大規模モデルの推論や学習において、メモリ使用量を削減しつつ効率を高める新しい技術として注目される。
ヤン・ルカン氏が講演で、現在のLLMは物理世界への理解が欠如していると指摘。真の知能には、世界モデル(World Model)を構築し、行動の結果を予測できるシステムが必要であると強調した。
Ramp はエージェント カードのベータ版をリリースしました。 AI エージェントは、人間が設定した支出制限と承認ワークフローが設定されたトークン化されたクレジット カードを取得します。 Mastercard と Google は、AI エージェントのトランザクションのための検証標準を構築しています。 Stripe は OpenAI を使用して Agentic Commerce Protocol を 6 か月間実行してきました。 Stripe の最大の発見: エージェントの推奨事項に製品が表示されるかどうかの最大の要因は、構造化された機械可読な製品データがあることです。あなたのブランドではあり...
数か月前、私はついに腰を据えて、チームが支払っているすべての AI サブスクリプションを監査しました。結局、私たちは基本的に同じ仕事をする重複したツールで毎月約 220 ドルを静かに消費していたことがわかりました。最近の調査によると、これは一般的であり、組織は AI サブスクリプション予算の平均 32% を冗長なツールや十分に活用されていないツールに浪費しています。私が個人的に遭遇した最大の重複カテゴリ(そして他の創設者と今でもよく見られる): 複数のフロンティア LLM(ChatGPT、Claude、Gemini など) いくつかの画像生成プラットフォーム 機能が高速に統合されたビデオ生成お...
UVAの研究チームが、拡散モデルを活用し、タンパク質の形状変化(induced fit)を考慮して精密な創薬分子を設計するAIツール群「YuelDesign」等を開発。創薬の効率化と成功率向上が期待される。