直近1週間の更新
2/7 (土)

日刊IETF (2026-02-06) Part 1/2 ― LLM URIスキーム登場&AIエージェント認可、証明書管理の刷新まで一気読み
LLMタグが付けられた新着記事 - Qiita
こんばんは!GMOコネクトの名もなきエンジニアです。よろしくお願いします!日刊IETFは、I-D AnnounceやIETF Announceに投稿されたメールをサマリーし続けるという修行的な活動です!!今回は、2026-02-06(UTC基準)に公開されたInte...
8分前

AWS Lambda Managed Instances のコストを Billing and Cost Management から確認してみた
DevelopersIO
AWS Lambda Managed Instances のコストを Billing and Cost Management から確認してみた
31分前

AI Agent yagi を作った
1
Zennの「大規模言語モデル」のフィード
はじめに最近 AI Agent が流行っていますが、Agent とツール、skill や identity の関係がいまいちピンと来ていませんでした。ドキュメントを読むだけでは理解が深まらないので、実際に自分で作ってみるかと手を動かしていたら、知らない間にある程度動く物が出来上がっていました。yagi という CLI チャットクライアントです。https://github.com/yagi-agent/yagi名前の由来は Go のインタプリタ Yaegi から来ています。yagi は複数の LLM プロバイダに対応した CLI チャットクライアントで、Yaegi を使ったプ...
1時間前

年末年始にBitNetを実装して実用性を確かめた
Zennの「大規模言語モデル」のフィード
はじめに年末年始に時間ができたので、以前話題になったBitNetについて改めて調べてみた。BitNetはMicrosoftが2024年に提案した1.58-bit量子化手法で、重みを{-1, 0, +1}の3値だけで表現する。当時は「スマホでも大規模LLMが動くのでは」という期待もあったが、2026年現在、実用化の話はあまり聞かない。調べてみると学習時のオーバーヘッドやGPUとの相性問題があるようだったが、エッジデバイスで大規模モデルを動かすという話は魅力的だし、実際どうなのか気になったので自分でTritonカーネルを実装して確かめてみることにした。なお、実装にはClaude Co...
1時間前

LLMの中に「脳の報酬系」が勝手に生まれていた話
LLMタグが付けられた新着記事 - Qiita
LLMの中に「脳の報酬系」が勝手に生まれていた話はじめに「AIの中身ってどうなってるの?」この素朴な疑問に対して、衝撃的な発見が報告されました。LLM(大規模言語モデル)の内部に、人間の脳にある「ドーパミンニューロン」とそっくりな構造が見つかったというのです。2...
1時間前

暴走するRAGソクラテスと、メタ認知アーキテクチャの実装の必要性
Zennの「大規模言語モデル」のフィード
自作RAG「ソクラテス」に学習指導要領を覚えさせたものの、運用テストで問題発生。「鶏むね肉のレシピ」に合いの手を添えたり、無限に深掘りする暴走AIに...。プロンプトのおまじないに頼らず、PythonによるHOOK機構(RAS)を実装して「理性」を獲得させるまでの技術&検証記録です。本記事は、自作RAGで搭載したソクラテス(コーチングモード)の「学習指導要領を定義した文章を食わせての実装・検証編」(vol.2)の続きです。https://zenn.dev/mizunadad/articles/d0b6c13fac6832 はじめに:構造化データのみの行く末、、、前回(Vol...
1時間前

Goでllm用にtoken数を測る
Zennの「大規模言語モデル」のフィード
tiktoken-goを使うことでgpt-4を参考にしたトークナイズを行える。https://github.com/pkoukk/tiktoken-gogo get github.com/pkoukk/tiktoken-gopackage mainimport ("fmt""github.com/pkoukk/tiktoken-go")func truncateTokens(s string, limit int) (*string, error) {tkm, err := tiktoken.EncodingForModel("gpt-4")if err...
2時間前

LFM2.5を試してみた
LLMタグが付けられた新着記事 - Qiita
今回紹介するモデルLFM2.5LFM2.5モデル概要ベースモデル: LFM2.5-1.2B-Baseコンテキストサイズ: 128kパラメータ数: 1.2B使用VRAM: 1.5~2GB(Q4_K_M)公式対応言語: 英語想定用途: 汎用型...
2時間前

開発環境状況確認2026
Zennの「大規模言語モデル」のフィード
はじめに2026年、AIエージェントを開発環境に統合するのが当たり前になってきました。しかし、単にAIツールを導入するだけでは、日本語入力の切り替えやプロンプト入力の煩雑さなど、細かなストレスが積み重なります。本記事では、Claude CodeとEmacsを中心に、徹底的にモードレスな操作を追求した私の開発環境を紹介します。日本語入力モードを排除し、プロンプトは任意のファイルに直接書き、すべての操作をストレスなく行える環境を実現しました。 使用ソフトウェアmacOS 26.2Claude Codeemacs-ai-agent-bridgetmuxEmacs 30....
3時間前

「複数AIに同じプロンプトを投げて比較する」をツール化した — SRPスキルファイル公開
Zennの「大規模言語モデル」のフィード
!この記事の要点: 「同じプロンプトを複数AIに投げて比較する」は多くの人がやっています。SRP(Stochastic Resonance Prompting)はそれを方法論にしたもので、今回Claude Codeのカスタムスキルとして実装・公開しました。手動版(/srp、外部依存ゼロ)と自動版(/quick-homo-srp、Codex CLIで並列実行)の2つがあります。 はじめに — やっている人は増えている最近、Xでこんなツイートを見かけました。claude と codex の両方に人力でお願いしてコードのレビューしてもらっていたので、4並列(Opus 4.6, O...
3時間前

GPUなしNPUなしノートPCでSLMはどこまで戦えるか? 〜WSL2+Ollamaで挑む「SLM三本勝負」の記録〜
Zennの「大規模言語モデル」のフィード
※筆者注: 検証自体は軽い気持ちで着手したのですが、非常に長い記事になってしまいましたのでご注意ください。 はじめに以前の記事でも書いた通り、普段はGeminiやChatGPTなどのクラウドLLMを使っており、日々の業務ではその恩恵をそれなりに受けております。スペック駆動による AIエージェントコーディングも、それなりに定着してきて、これまでは時間やスキルの関係でなかなか手が出せなかった開発も、結構実現できるようになってきました。https://zenn.dev/snaga/articles/2025-07-26-kiro-geminihttps://zenn.dev/snag...
4時間前

Opus 4.6 をサポートした Kiro で、Step Functions + JSONata で Lambda レスなディスク監視を実装してみた
DevelopersIO
Kiro CLI の最新モデル Claude Opus 4.6 を活用し、Step Functions の SDK 統合と JSONata で Lambda レスなディスク枯渇予測監視を実装しました。CloudWatch Agent のメトリクスから過去のトレンドを分析し、ディスクフルを事前に予測して SNSで通知します。実装のハマりどころや Opus 4.6 による JSONata 処理能力の向上についても紹介します。
4時間前

Windows 11のCPUで軽量LLM「LFM2.5-1.2B」を動かす方法
LLMタグが付けられた新着記事 - Qiita
導入「手元のWindows PCで、ネットに繋がず、かつGPUも使わずにLLMを動かしたい」そんな願いを叶えるべく、Liquid AIが公開した日本語に強い軽量モデルLFM2.5-1.2Bを、推論エンジンllama.cppで動かすまでの手順をまとめました。特徴として...
4時間前

なぜ、Claude Codeは、RAGを捨ててAgentic Searchを選んだのか?
Zennの「大規模言語モデル」のフィード
ちょっと前のことですが、Claude Codeの開発者であり、AnthropicのエンジニアでもあるBoris Cherny氏(@bcherny)が、「初期のClaude CodeではRAG+ローカルベクターDBを使っていたが、最終的にAgentic Searchの方が圧倒的に良いと分かった」 と発言がありましたhttps://x.com/bcherny/status/2017824286489383315私はBoris氏のこの投稿を見たとき「やっぱ、そうだよな」と思いました。なぜなら、私もRAGで検索システムを作り、似たような壁にぶつかったことがあるからです。この記事では、この騒動...
4時間前

GitLab DuoでOpenCodeが使えるようになった
Zennの「大規模言語モデル」のフィード
はじめにGitLab Duoのサブスクリプション契約者が、OpenCodeを公式に利用できるようになった。ClaudeのSonnet、Opus、Haikuという全モデルが使える。これは開発者にとって新しい選択肢だ。 構造の変化ツールの統合は、開発の風景を少しずつ変える。従来、コーディング支援ツールは個別に契約し、個別に設定していた。GitLabはもともとCI/CDプラットフォームとして、開発フローの中核にあった。そこにAIコーディングエージェントが公式に統合されることで、フローの中にAIがより深く溶け込んでいく。従来のフロー:コードエディタ (Copilotなど) →...
4時間前

Control Tower環境でメンバーアカウントからCloudTrailイベントをEventBridgeでキャッチする方法
DevelopersIO
Control Tower環境でメンバーアカウントからCloudTrailイベントをEventBridgeでキャッチする方法
5時間前

CloudWatch Synthetics Canaryを作成して、発行されるメトリクスの種類を確認してみた
DevelopersIO
CloudWatch Synthetics Canaryを作成して、発行されるメトリクスの種類を確認してみた
5時間前

DGX Spark の 128GB メモリで Claude Code + Ollama のローカル実行に再挑戦してみた
DevelopersIO
DGX Spark の 128GB メモリで Claude Code + Ollama のローカル実行に再挑戦してみた
6時間前

The Friction Economy: Why Gen Z Is Trading Smartphones for Dumb Devices
PYMNTS.com
There’s a special look kids give a floppy disk. They turn it over, tap the little metal shutter, and then ask, politely but devastatingly: “So where do you plug in the Wi‑Fi?” It’s the same energy adults bring to a rotary phone: reverence, confusion and the suspicion that someone is filming a prank video. After […]The post The Friction Economy: Why Gen Z Is Trading Smartphones for Dumb Devices appeared first on PYMNTS.com.
6時間前

strace で C / Go / Rust / Python / Node.js のシステムコールを覗いてみた。
DevelopersIO
strace で C / Go / Rust / Python / Node.js のシステムコールを覗いてみた。
8時間前

Claude Opus4.6はどのようにPPTXを生成しているか
19
Zennの「大規模言語モデル」のフィード
2026年2月5日にAnthropicから新しいフラグシップモデルであるClaude Opus4.6がリリースされました。さまざまな新機能が搭載されていますが、その中でも特にSNSなどで注目されているのはPowerPointプレゼンテーションファイル(PPTX)を高品質に生成できる能力です。ちょうど開発しているLLMアプリケーションにPPTX生成機能を組み込む予定があったため、Claude Opus4.6がどのようにPPTXファイルを生成しているのか、その技術的な背景と全体フローについて調査しながらまとめてみました。ちょっと宣伝Microsoft Azureで提供されるMicr...
11時間前

Azure Application Gateway WAF ポリシー で Microsoft_DefaultRuleSet_2.2 が使えるようになりました
DevelopersIO
Azure Application Gateway WAF ポリシー で Microsoft_DefaultRuleSet_2.2 が使えるようになりました
11時間前
Virgin Media O2 Bets on Affirm to Fuel Hardware Sales
PYMNTS.com
Virgin Media O2, a leading mobile provider in the United Kingdom, has partnered with flexible payment network Affirm to provide hardware financing. This collaboration will allow O2 customers to access Affirm’s pay-over-time options at checkout when purchasing mobile phones, headphones, game consoles and other hardware, the companies said in a Friday (Feb. 6) press release. Affirm will offer a wide range of monthly payment plans and will charge no late […]The post Virgin Media O2 Bets on Affirm t
12時間前

MixSeek Quant Insight - アルゴ量産から特徴量設計までをカバーするコンペ型AIエージェント
Zennの「大規模言語モデル」のフィード
MixSeek Quant Insightとはアルゴ量産から特徴量設計までをカバーするコンペ型AIエージェントMixSeek Quant Insightを先日オープンソースでリリースしました。https://github.com/mixseek/mixseek-quant-insightMixSeek Quant InsightはMixSeekのコンペ型アーキテクチャを活かし、アルゴ量産から特徴量設計、リスクシグナルまで金融時系列の分析に対応した拡張パッケージです。これまで私は2個のKaggleコンペの問題設計を担当してきましたが、そこで培ったノウハウを最大限詰め込んだパッケー...
13時間前

Early Buying Spree Cannibalizes Fourth Quarter Car Sales
PYMNTS.com
AutoNation saw a year-over-year decline in vehicle sales during the fourth quarter due to a tough comparison to 2024 and a race to buy vehicles earlier in the year before the implementation of tariffs and expiration of electric vehicle tax credits, executives said Friday (Feb. 6). The automotive retailer’s same-store new vehicles sales were […]The post Early Buying Spree Cannibalizes Fourth Quarter Car Sales appeared first on PYMNTS.com.
13時間前

LLM 演習
Zennの「大規模言語モデル」のフィード
2024の時は、翌年、若い人に参加してもらおうと、無料枠でやることを目標にしており、結果は提出できたものの、初めてのツールに振る舞わされ、十分なエラーの記録と対策を整理できず、今年は利用するツールを事前に触って確認しながらきました。有給休暇をとったものの、午前中で無料枠を使い果たし、午後、遊んでいるわけにもいかず、有償枠に突入しました。Google Colab, Hugging faceと、gitlab or githubの連携がうまく設定できておらず、エラー記録が全部はできていません。公開できないこともあることを想定し、プライベートでの運用を検討しています。課題としては、いろいろなサー...
13時間前

AI Enters the Race at the Winter Olympic Games
PYMNTS.com
Artificial intelligence (AI) is also entering the race at the 2026 Winter Olympics in Milano Cortina, Italy, which runs through Feb. 22, bringing a layer of machine intelligence to an event long defined as a showcase of human performance. From athlete training and broadcast production to fan engagement and judging, AI systems are increasingly […]The post AI Enters the Race at the Winter Olympic Games appeared first on PYMNTS.com.
13時間前

[アップデート] AWS Configが新しく30個のリソースタイプに対応しました
DevelopersIO
[アップデート] AWS Configが新しく30個のリソースタイプに対応しました
13時間前

なぜ、「AI時代=裏技が通用しない時代」なのか?
Zennの「大規模言語モデル」のフィード
はじめにAI時代とは何かと問われたとき、多くの人は生産性向上や自動化、あるいは仕事が奪われるといった分かりやすい話題を思い浮かべます。しかし本質はそこではありません。AI時代の核心は、裏技や小手先、抜け道がほとんど意味を持たなくなった点にあります。かつて有効だったノウハウ集やテクニック本が急速に陳腐化し、プロンプトエンジニアリングという言葉自体が短命に終わった事実は、この変化を象徴しています。このレポートでは、なぜ「AI時代=裏技が通用しない時代」となったのかを、技術進化の構造と人間側の認知特性の両面から整理し、現在語られるAI人材不足の正体までを論じていきます。 裏技が成立...
14時間前

リリースされたClaude Opus 4.6はパワポを出力してくれた
Zennの「大規模言語モデル」のフィード
https://www.anthropic.com/news/claude-opus-4-6 何をしてくれたか「衆院選2026の獲得議席予想を調査してパワーポイントにまとめて」この一言で、Claude Opus 4.6は以下を全自動でやってくれました。Web検索を3回実行し、JNN・FNN・日経・共同通信の終盤情勢データを収集PPTX作成スキルを自分で読み込み、ベストプラクティスを把握pptxgenjsでチャート・表組み含む全10スライドを生成PDF→画像変換して自分でスライドを目視QA問題なければファイルを納品私がやったことは最初の一文を入力しただけです。...
14時間前

Apple Opens CarPlay to AI Rivals Following Driver Demand
PYMNTS.com
Apple plans to allow other companies’ voice-controlled artificial intelligence (AI) chatbots to operate within its vehicle interface, CarPlay, Bloomberg reported Friday (Feb. 6), citing unnamed sources. The company is working to support these third-party apps in CarPlay and plans to make this capability available to AI providers within months, according to the report. Currently, Apple allows […]The post Apple Opens CarPlay to AI Rivals Following Driver Demand appeared first on PYMNTS.com.
14時間前

Home Depot AI Battles for the Pro Wallet
PYMNTS.com
The Home Depot has launched an artificial intelligence (AI)-powered feature that helps professional renovators, remodelers, builders and specialty tradespeople create a list of the materials they will need for a project. With the new Material List Builder AI, these professionals can input details of the project and then receive a draft material list that […]The post Home Depot AI Battles for the Pro Wallet appeared first on PYMNTS.com.
14時間前

Credit Data Shows Spending Discipline as Card Balances Rise
PYMNTS.com
The Federal Reserve’s latest consumer credit data points to a familiar seasonal pattern, with revolving balances moving higher as households navigated year-end expenses and holiday purchases. According to the Fed’s December G.19 report released Friday afternoon (Feb. 6), total consumer credit expanded at a seasonally adjusted annual rate of 5.7%, a sharp pickup from […]The post Credit Data Shows Spending Discipline as Card Balances Rise appeared first on PYMNTS.com.
15時間前

Quoting Tom Dale Simon Willison's Weblog
<blockquote cite="https://twitter.com/tomdale/status/2019828626972131441"><p>I don't know why this week became the tipping point, but nearly every software engineer I've talked to is experiencing some degree of mental health crisis.</p><p>[...] Many people assuming I meant job loss anxiety but that's just one presentation. I'm seeing near-manic episodes triggered by watching software shift from scarce to abundant. Compulsive behaviors around agent usage. Dissociative awe...
15時間前

Google World Model AI Accelerates Waymo Robotaxi Expansion
PYMNTS.com
Self-driving vehicle startup Waymo said Friday (Feb. 6) that the latest virtual world in which it is developing its artificial intelligence (AI) will enhance the company’s ability to scale its service in the real world. The company’s newly introduced Waymo World Model is built on Google DeepMind’s general purpose world model Genie 3, which Waymo then adapted […]The post Google World Model AI Accelerates Waymo Robotaxi Expansion appeared first on PYMNTS.com.
16時間前

The Next Open Source Security Race: Triage at Machine Speed
Socket
Claude Opus 4.6 has uncovered more than 500 open source vulnerabilities, raising new considerations for disclosure, triage, and patching at scale.
16時間前

Running Pydantic's Monty Rust sandboxed Python subset in WebAssembly Simon Willison's Weblog
<p>There's a jargon-filled headline for you! Everyone's <a href="https://simonwillison.net/2026/Jan/8/llm-predictions-for-2026/#1-year-we-re-finally-going-to-solve-sandboxing">building sandboxes</a> for running untrusted code right now, and Pydantic's latest attempt, <a href="https://github.com/pydantic/monty">Monty</a>, provides a custom Python-like language (a subset of Python) in Rust and makes it available as both a Rust library and a Python package. I got it w...
17時間前

San Francisco Fed Chief Spots Risky Economic Disconnect
PYMNTS.com
Businesses and workers have different views of the economy, Federal Reserve Bank of San Francisco President and CEO Mary C. Daly said in a Friday (Feb. 6) post on LinkedIn. Businesses are “cautiously optimistic,” with good growth, solid consumer spending easy hiring and rising productivity, Daly said. Workers are “not so sure,” as they […]The post San Francisco Fed Chief Spots Risky Economic Disconnect appeared first on PYMNTS.com.
17時間前

Claude Code Skills は内部でどう動いているのか — 英語圏の解析記事を読み解く
Zennの「大規模言語モデル」のフィード
はじめにClaude Code の Skills を使っていて、「これ内部的にはどういう仕組みで動いているんだろう」と気になったことがありました。公式ドキュメントには「description は常にコンテキストに読み込まれる」「呼び出されたときに本文が展開される」といった記述がありますが、具体的にどんな構造でそれが実現されているのかまでは書かれていません。調べてみたところ、英語圏では Claude Code のセッション中の API 通信を記録・解析した記事がいくつか公開されていました。特に以下が詳しいです。Mikhail Shilkov - Inside Claude C...
18時間前

Gemini Slashes Staff and Exits Europe to Chase Prediction Market Profits
PYMNTS.com
Crypto company Gemini is cutting its workforce by 25% and exiting the United Kingdom, European Union and Australia as it sharpens its focus on prediction markets and the United States. Gemini CEO Tyler Winklevoss and President Cameron Winklevoss announced the changes in a Thursday (Feb. 5) blog post. The company’s withdrawal from overseas markets and its headcount […]The post Gemini Slashes Staff and Exits Europe to Chase Prediction Market Profits appeared first on PYMNTS.com.
18時間前

An Update on Heroku Simon Willison's Weblog
<p><strong><a href="https://www.heroku.com/blog/an-update-on-heroku/">An Update on Heroku</a></strong></p>An ominous headline to see on the official Heroku blog and yes, it's bad news.</p><blockquote><p>Today, Heroku is transitioning to a sustaining engineering model focused on stability, security, reliability, and support. Heroku remains an actively supported, production-ready platform, with an emphasis on maintaining quality and operationa...
20時間前

【登壇資料】 Midosuji Tech #8で「AI時代に考えるビギナーエンジニア×スキルトランスファーとの向き合い方」というタイトルで登壇しました!#midosuji_tech
DevelopersIO
【登壇資料】 Midosuji Tech #8で「AI時代に考えるビギナーエンジニア×スキルトランスファーとの向き合い方」というタイトルで登壇しました!#midosuji_tech
1日前
2/6 (金)

AIベンチマーク読み方ガイド|SWE-bench・GPQA・ARC-AGIの意味と活用法
Zennの「大規模言語モデル」のフィード
AIベンチマーク読み方ガイド:スコアの意味と実践的な活用法Claude Opus 4.6とGPT-5.3-Codexが同日リリースされた2026年2月、AIモデルの選択肢はかつてないほど増えています。「SWE-bench 80%」「ARC-AGI 68%」といった数字が飛び交いますが、それぞれ何を測っていて、自分のタスクにどう関係するのか。この記事では、主要ベンチマークの読み方と、コーディング業務への活かし方を解説します。 この記事の対象読者AIコーディングツール(Claude Code、Cursor、GitHub Copilot等)を使っている開発者モデル選定の判断材...
1日前

Reverse Engineering Your Software Architecture with Claude Code to Help Claude Code
Radar
This post first appeared on Nick Tune’s Medium page and is being republished here with the author’s permission. I have been using Claude Code for a variety of purposes, and one thing I’ve realized is that the more it understands about the functionality of the system (the domain, the use cases, the end-to-end flows), the […]
1日前

パートナーイベントソースと EventBridge イベントバスの関連付けを Terraform で実施する
DevelopersIO
パートナーイベントソースと EventBridge イベントバスの関連付けを Terraform で実施する
1日前

少数データソースへのプロンプト改善を加速させるCLIを作ってみた
DevelopersIO
プロンプトの返答が想定されたものに近しいかのチェックは中々困難です。特に状況によっては、検証用途で立てたRAGのコストが無視しづらい時もあります。少数少量のデータソースという前提の元にサクッと検証するためのCLIを作ってみました。
1日前

Claude Opus 4.6 vs GPT-5.3 Codex ― 同日リリースの最強AIコーディングモデルを徹底比較〜2026年2月版〜
Zennの「大規模言語モデル」のフィード
この記事の対象読者AIコーディングツール(Claude Code / Codex)に興味がある方Python / JavaScript でAIを活用した開発を行っている方「結局どっちを使えばいいの?」と悩んでいるエンジニアAIモデルの選定基準を知りたいチームリーダー・テックリード この記事で得られることベンチマーク比較の全貌: Terminal-Bench、SWE-Bench Pro、OSWorld等の主要指標で両モデルを横並び比較アーキテクチャの設計思想の違い: 「推論の深さ」vs「実行速度」、Agent Teams vs 単一エージェント長期実行ユー...
1日前

Making AI work for everyone, everywhere: our approach to localization
OpenAI News
OpenAI shares its approach to AI localization, showing how globally shared frontier models can be adapted to local languages, laws, and cultures without compromising safety.
1日前

Claude Opus 4.6が来た!1Mトークン&Agent Teamsで開発はどう変わるか
Zennの「大規模言語モデル」のフィード
この記事は2026年2月5日にリリースされたClaude Opus 4.6の新機能と、開発ワークフローへの実践的な影響をまとめたものです。https://www.anthropic.com/news/claude-opus-4-6(2026-02-06時点)Agent Teamsは実験的機能(Research Preview)です。仕様が変更される可能性があります。https://code.claude.com/docs/en/agent-teams TL;DRコンテキスト5倍: 200K → 1Mトークン(ベータ)。大規模コードベースを一括で読めるAgent Tea...
1日前

ずんだもん×枕草子×AI:VTuberで古典文学を令和ギャル語で朗読してみた
Zennの「大規模言語モデル」のフィード
Graph RAGの学習中にふと浮かんだ疑問──「AI generated VTuber」は実現できるのか?LLMが生成した『枕草子』の現代語訳を、VOICEVOXのずんだもんが朗読する。https://youtu.be/5KLxY5uBiRY?si=T8wKmBF3WN2bgPEK3DモデルのリップシンクからOBS録画、SNS公開までの全自动化プロセスを記録します。 はじめに:Graph RAGとの出会い「Never gonna give you up」──こう入力すると、LLMは続きの「Never gonna let you down」を予測して答える。これはLLMの「...
1日前

Amazon BedrockでStructured Outputs試してみた
1
Zennの「大規模言語モデル」のフィード
はじめにFusicのレオナです。今回は2026年2月にAmazon BedrockにStructured Outputsが追加されたので試してみます。 Structured Outputsとは基盤モデルからの応答を、ユーザー定義のJSONスキーマに厳密に準拠させることが可能になりました。従来のプロンプトベースのアプローチでは、モデルにユーザーの望むJSON形式で出力させることが不確実であり、バリデーション処理などの工夫が必要でした。Structured Outputsはこの問題を解決してくれます。https://aws.amazon.com/jp/about-aws/wh...
1日前

【TypeScript】DynamoDBでもトランザクション用の汎用的なサービスクラスを作りたい
1
DevelopersIO
【TypeScript】DynamoDBでもトランザクション用の汎用的なサービスクラスを作りたい
1日前

AWS上にObservability検証環境を構築してみた(Grafana + Tempo + Loki + AMP)
DevelopersIO
AWS上にObservability検証環境を構築してみた(Grafana + Tempo + Loki + AMP)
1日前

Claude Codeを使ったSaaSセキュリティチェックの自動化
59
カミナシ エンジニアブログ
コーポレートエンジニアの @sion_cojp です。 この記事では、Claude Code を使って SaaS セキュリティチェックを自動化した取り組みについて紹介します。 SaaSセキュリティチェックとは? 従業員が新しい SaaS を業務で利用したい場合、その SaaS がセキュリティ面で問題ないかを、コーポレートエンジニアが事前にチェックします。 チェック項目の一部を挙げると以下のような内容です。 公的認証資格を取得しているか(SOC など) MFA(多要素認証)/二段階認証に対応しているか 解約後にデータは完全に削除されるか 準拠法・管轄裁判所の確認 また近年では、SaaS に AI…
1日前

Strands AgentsのA2AでHTTPベースのエージェント間通信を試してみた
DevelopersIO
Strands AgentsのA2AでHTTPベースのエージェント間通信を試してみた
1日前

GitHub Actions Self-hosted Runner 基盤の EKS バージョンアップを自動化した話
Timee Product Team Blog
こんにちは、タイミーでエンジニアをしている徳富(@yannKazu1)です。 前回の記事では、EKS 上に self-hosted GitHub Actions Runner 基盤を構築した話をご紹介しました。 ▼ 前回の記事 https://tech.timee.co.jp/entry/2025/09/22/122415 ありがたいことに、この取り組みは AWS さんの公式ブログでもご紹介いただきました。 👉 AWS ブログ https://aws.amazon.com/jp/blogs/news/timee-amazon-eks-auto-mode/ 今回はその続編として、 EKS のクラ…
1日前

AAAI-2026 参加報告
TECH BLOG | 株式会社AI Shift
はじめに こんにちは、AIチームの村田(@em_portero)です。 1月に AAAI-2026(The 40th Annual AAAI Conference on Artificial Intelligence)に […]投稿 AAAI-2026 参加報告 は 株式会社AI Shift に最初に表示されました。
1日前

【アップデート】Amazon Bedrock で Claude Opus 4.6 が利用可能になりました
DevelopersIO
【アップデート】Amazon Bedrock で Claude Opus 4.6 が利用可能になりました
1日前

SnowflakeのDBマイグレーションツールであるschemachangeを使ってみた
DevelopersIO
SnowflakeのDBマイグレーションツールであるschemachangeを使ってみた
1日前

マルチパーティ承認ポータルへのアクセス時に Access Denied が発生するようになった
DevelopersIO
マルチパーティ承認ポータルへのアクセス時に Access Denied が発生するようになった
1日前

SRE Kaigi 2026で「Sansanの認証基盤のこれまでとこれから」について登壇しました
Sansan Tech Blog
SRE Kaigi 2026での登壇の様子 こんにちは!技術本部 Platform Engineering Unitの樋口です。 2026年1月31日(土)にSRE Kaigi 2026が開催されました。 弊社からは、私と鷹箸が採択されメインホールで登壇してきました。 2026.srekaigi.net 今回の発表について speakerdeck.com 私は、メインホールの3番手として コスト削減から「セキュリティと利便性」を担うプラットフォームへ Sansanの認証基盤のこれまでとこれから というタイトルで登壇しました。 Bill Oneではコスト削減を背景に認証基盤を内製化しAuth0か…
2日前

kintone AI でも Kubernetes はじめました
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事はkintoneの生成AIチームで連載中のkintone AIリレーブログ2026の2本目の記事です。 リレーブログでは、生成AIチームのメンバーがAIトピックに限らずさまざまなことについて発信していきます。こんにちは! kintoneの生成AIチームでバックエンドの開発・運用を担当している 齋藤 ( K.Saito (@SightSeekerTw) / X ) です。以前、kintone AI ラボ のバックエンドを OpenTelemetry と AWS CloudWatch Application Signals で可観測性を向上させた話 という記事で kintone の AI 機能を実現しているアーキテクチャについて簡単に紹介しました。この記事の中ではアプリケーション部分は AWS の Lambda 関数としてデプロイして運用していたのですが、この度 Kubernetes (Amazon EKS) の基盤を構築し、こちらに移行する運びとなったことをご報告いたします。ここでは、どういった経緯、モチベーションで Kubernetes に移行することになったのかを紹介したいと
2日前

OpenTaco MCPサーバーを使ってOpenTaco関連のドキュメントを検索してみた
DevelopersIO
OpenTaco MCPサーバーを使ってOpenTaco関連のドキュメントを検索してみた
2日前

UIって何だろう?⑧ 〜アクセシビリティの基本と使いやすいデザインの関係〜
DevelopersIO
「ボタンが小さくて押しにくい」「文字が薄くて読みづらい」そんな経験はありませんか?アクセシビリティは、障害者や高齢者向けの特別な配慮ではなく、あらゆる状況下のすべての人にとっての使いやすさを支える、UIデザインの基本です。色・文字・構造・サイズの観点から、具体例とともにやさしく解説します。
2日前

Claude in PowerPoint で Claude による PowerPoint 作成支援機能を試してみた
3
DevelopersIO
Claude in PowerPoint で Claude による PowerPoint 作成支援機能を試してみた
2日前

Bill One QAが目指す姿 -「品質を守る」から「働き方を変える価値を届ける」組織へ
Sansan Tech Blog
この記事は、Bill One開発Unit ブログリレー2025の第22弾になりますこんにちは。Bill One QAマネジャーの秋元真理子です。2024年4月に入社して以来Bill One QAに配属され、現在はグループマネジャーとして、日本のメンバーだけでなく、フィリピン・セブ島にあるSansan Global Development Center (SGDC) のメンバーと共に、日々Bill Oneの品質に向き合っています。入社からこれまで、Bill One QAが目指すべき姿については、日々のミーティングやSlackでのやり取りを通じて断続的に発信してきました。しかし、私たちが何のために…
2日前

Quoting Karel D'Oosterlinck Simon Willison's Weblog
<blockquote cite="https://twitter.com/kareldoostrlnck/status/2019477361557926281"><p>When I want to quickly implement a one-off experiment in a part of the codebase I am unfamiliar with, I get codex to do extensive due diligence. Codex explores relevant slack channels, reads related discussions, fetches experimental branches from those discussions, and cherry picks useful changes for my experiment. All of this gets summarized in an extensive set of notes, with links back to where ea...
2日前

Malicious dYdX Packages Published to npm and PyPI After Maintainer Compromise
Socket
Malicious dYdX client packages were published to npm and PyPI after a maintainer compromise, enabling wallet credential theft and remote code execution.
2日前

QAエンジニアはなぜ「心配性」であるべきなのか?——健全な疑念のススメ
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の129週目の記事です!3年間連続達成まで残り30週となりました! はじめに2025年8月に、株式会社ログラスへQAエンジニアとして入社しました劉と申します。QAエンジニアという仕事をしていると、周囲から「慎重ですね」と言われることがよくあります。しかし、私たちが持っているのは単なる慎重さではなく、プロダクトを守り抜くための 「健全な疑念(Healthy Skepticism)」 であるべきだと考えています。今回は、インテルの元CEOアンディ・グローブの言葉を引用しながら、品質管...
2日前

Mitchell Hashimoto: My AI Adoption Journey Simon Willison's Weblog
<p><strong><a href="https://mitchellh.com/writing/my-ai-adoption-journey">Mitchell Hashimoto: My AI Adoption Journey</a></strong></p>Some really good and unconventional tips in here for getting to a place with coding agents where they demonstrably improve your workflow and productivity. I particularly liked:</p><ul><li><p><a href="https://mitchellh.com/writing/my-ai-adoption-journey#step-2-reproduce-your-own-work">Reproduce your ...
2日前

Opus 4.6 and Codex 5.3
Simon Willison's Weblog
<p>Two major new model releases today, within about 15 minutes of each other.</p><p>Anthropic <a href="https://www.anthropic.com/news/claude-opus-4-6">released Opus 4.6</a>. Here's <a href="https://gist.github.com/simonw/a6806ce41b4c721e240a4548ecdbe216">its pelican</a>:</p><p><img alt="Slightly wonky bicycle frame but an excellent pelican, very clear beak and pouch, nice feathers." src="https://static.simonwillison.net/static/2026/opus-4...
2日前

gem.coop Tests Dependency Cooldowns as Package Ecosystems Move to Slow Down Attacks
Socket
gem.coop is testing registry-level dependency cooldowns to limit exposure during the brief window when malicious gems are most likely to spread.
2日前

コードエディタに統合するAIエージェントを自由に選べる「ACP(Agent Client Protocol)レジストリ」始動。Gemini CLIやGitHub Copilot、OpenCodeなどが対応
Publickey
JetBrainsとZedは、AIエージェントをどのコードエディタでも使えるようにする「ACP(Agent Client Protocol)」に対応したAIエージェントのレジストリ「ACPレジストリ」の公開を発表しました(JetBrains...
2日前
2/5 (木)

The Agentic Commerce Revolution
Radar
For 30 years, digital commerce has been a destination. We “go to” a website, a marketplace, or an app. In this single, bundled environment, we handle discovery, comparison, and checkout. The entire architecture of the web, from product pages to payment gateways, is built on this assumption. This assumption is now facing its first real […]
2日前

Qwen3-Coder-Next 80Bがコード書けるけど失敗の質が悪すぎてダメな理由をアーキテクチャから見てみる
きしだのHatena
Qwen3-Coder-Nextが出ていますね。 Qwen3-Coder-Next: Pushing Small Hybrid Models on Agentic Coding Qwen3-Next 80B-A3Bをベースにしたコーディングモデルです。80Bで、Activeパラメータは3Bということで、かなり軽快に動きます。 しかし、元になるQwen3-Nextでは一発のコードはかけるものの やりとりすると弱く、あまりコードは書かせれないなと思っていたので、同じアーキテクチャならちょっと不安が。Qwen3-Nextは線形アテンションを取り入れてるけど、コーディングには向かないんじゃなかろうか、…
2日前

GPT-5 lowers the cost of cell-free protein synthesis
OpenAI News
An autonomous lab combining OpenAI’s GPT-5 with Ginkgo Bioworks’ cloud automation cut cell-free protein synthesis costs by 40% through closed-loop experimentation.
2日前

優先度の「なんとなく」から脱却する。優先度を明確にするためのステップ
Wantedly Engineer Blog
こんにちは、WantedlyでPdMをしている上山です。 Visit Social Squad で Wantedl...
2日前

Introducing Trusted Access for Cyber
OpenAI News
OpenAI introduces Trusted Access for Cyber, a trust-based framework that expands access to frontier cyber capabilities while strengthening safeguards against misuse.
2日前

ウォンテッドリーのLLM アプリケーション自動テスト戦略
Wantedly Engineer Blog
こんにちは、ウォンテッドリーでソフトウェアエンジニアをしている市古 (@sora_ichigo_x) です。現在は...
2日前

Introducing OpenAI Frontier
OpenAI News
OpenAI Frontier is an enterprise platform for building, deploying, and managing AI agents with shared context, onboarding, permissions, and governance.
2日前

Spotlighting The World Factbook as We Bid a Fond Farewell Simon Willison's Weblog
<p><strong><a href="https://www.cia.gov/stories/story/spotlighting-the-world-factbook-as-we-bid-a-fond-farewell/">Spotlighting The World Factbook as We Bid a Fond Farewell</a></strong></p>Somewhat devastating news today from CIA:</p><blockquote><p>One of CIA’s oldest and most recognizable intelligence publications, The World Factbook, has sunset.</p></blockquote><p>There's not even a hint as to <em>why</em> they...
3日前

Navigating health questions with ChatGPT
OpenAI News
A family shares how ChatGPT helped them prepare for critical cancer treatment decisions for their son alongside expert guidance from his doctors.
3日前

GPT-5.3-Codex System Card
OpenAI News
GPT‑5.3-Codex is the most capable agentic coding model to date, combining the frontier coding performance of GPT‑5.2-Codex with the reasoning and professional knowledge capabilities of GPT‑5.2.
3日前

Introducing GPT-5.3-Codex
OpenAI News
GPT-5.3-Codex is a Codex-native agent that pairs frontier coding performance with general reasoning to support long-horizon, real-world technical work.
3日前

生成AI活用を最大化させるチームへ。Musubi AI Codingギルド活動の取り組み
KAKEHASHI Tech Blog
はじめに こんにちは。Musubi 機能開発チームでエンジニアをしている菅原です。 Musubi チームでは、チーム全体に生成 AI を最大限活用した開発を根付かせるために、2025 年 12 月に AI Coding ギルド活動を立ち上げました。 本記事では、そのギルド活動開始の背景と活動内容をご紹介します。 活動の背景 カケハシでは、あらゆるプロダクトで生成 AI を使った開発効率化に向けて取り組みが行われています。 しかし Musubi チームでは個々での活用に留まり、まだ組織的に生成 AI を使った開発効率化を追求しているとはいえない状況でした。 Musubi チームはプロダクトの規模…
3日前

Voxtral transcribes at the speed of sound Simon Willison's Weblog
<p><strong><a href="https://mistral.ai/news/voxtral-transcribe-2">Voxtral transcribes at the speed of sound</a></strong></p>Mistral just released Voxtral Transcribe 2 - a family of two new models, one open weights, for transcribing audio to text. This is the latest in their Whisper-like model family, and a sequel to the original Voxtral which they released <a href="https://simonwillison.net/2025/Jul/16/voxtral/">in July 2025</a>.</p><p>...
3日前

そのコードのその行をどのようにAIが生成し、なぜ変更されたのか。コードのコンテキスト履歴を記録する標準「Agent Trace」。Cursor、Cognition、Google Julesらが提唱
Publickey
あるコードのある行がいつ、誰によって、どのような理由で書かれ、あるいは変更されてきたのかの履歴は、コードのコメントに記述する方法や、GitHubなどのソースコード管理ツールによってコードの更新時などに記録する方法があります。 しかしAIを用...
3日前

さくらのクラウド、ガバメントクラウドの条件クリアまであと3つまで到達。残りは統制やセキュリティ認証、オブジェクトストレージなどの一部に
142
Publickey
デジタル庁はガバメントクラウドの構築に関して、さくらのクラウドの開発計画の進捗状況を1月30日付けで公表しました。 5つのクラウドがガバメントクラウドに選出 ガバメントクラウドは日本政府共通のクラウドサービスの利用環境となるクラウドであり、...
3日前
2/4 (水)

Distributing Go binaries like sqlite-scanner through PyPI using go-to-wheel Simon Willison's Weblog
<p>I've been exploring Go for building small, fast and self-contained binary applications recently. I'm enjoying how there's generally one obvious way to do things and the resulting code is boring and readable - and something that LLMs are very competent at writing. The one catch is distribution, but it turns out publishing Go binaries to PyPI means any Go binary can be just a <code>uvx package-name</code> call away.</p><h4 id="sqlite-scanner">sqlite-scanner</h4...
3日前

Beyond Pilot Purgatory
Radar
The hard truth about AI scaling is that for most organizations, it isn’t happening. Despite billions in investment, a 2025 report from the MIT NANDA initiative reveals that 95% of enterprise generative AI pilots fail to deliver measurable business impact. This isn’t a technology problem; it’s an organizational design problem. The reason for this systemic […]
3日前

Unlocking the Codex harness: how we built the App Server
OpenAI News
Learn how to embed the Codex agent using the Codex App Server, a bidirectional JSON-RPC API powering streaming progress, tool use, approvals, and diffs.
3日前

kintoneのAI機能開発をスケールさせるためのチーム戦略
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事はkintoneの生成AIチームで連載中のkintone AIリレーブログ2026の1本目の記事です。リレーブログでは、生成AIチームのメンバーがAIトピックに限らずさまざまなことについて発信していきます。こんにちは、kintoneの生成AIチームでエンジニアリングマネージャー (EM) をしている立山です。kintoneにおけるAI機能のこれまで2024年夏:AI機能の開発を開始2024年10月:RAGを活用したAI機能を発表2025年4月:kintone AIラボとしてAI機能を一般提供開始2026年1月現在:提供機能数を拡大中(現在7つのAI機能を提供中)開発初期フェーズでは、まず価値のあるAI機能を素早く届けることを重視し、チーム自身が機能開発を担ってきました。kintone特有のコードベースの理解AIバックエンドの設計・運用・評価といった要素を同時に考える必要があり、チームの認知負荷が高まっていました。チーム方針の転換ちょうどそのタイミングで、毎年開催される大々的な社外向けのイベント(Cybozu Days)に向けてAI機能を量産する体制が求められました。この要求をき
3日前

Nagoya Tech Talk #2 〜AI × 〇〇〜【冬の陣】イベントレポート
Sansan Tech Blog
中部支店に勤務しているEight Engineering Unitの篠原です。 前回好評だったNagoya Tech Talk 〜AI × 〇〇〜【初陣】に続き、第2回として、「Nagoya Tech Talk #2 〜AI × 〇〇〜【冬の陣】」を開催しました。 sansan.connpass.com 前回はSansanの中部支店での開催でしたが、今回はご登壇もいただいた株式会社スタメン様のご厚意により、名古屋本社のイベントスペースをお借りしての開催となりました。 Opening Talkと会場の様子 2回目となる今回は、前回に続き「AI活用の最新事例」をテーマに、開発・組織・人の成長といっ…
3日前

Claude CodeやGemini CLIなどのコーディングエージェントを安全に使えるMicroVMベースの分離環境「Docker Sandbox」。WindowsとMacに対応
Publickey
Dockerは、WindowsとMacにコンテナ型仮想環境を容易に導入できるツール「Docker Desktop」に、MicroVMベースの分離環境を採用したDocker Sandbox機能を投入したことを発表しました。 For devs ...
4日前

Vol. 21 Google Cloud Pub/Sub利用時における分散トレーシングの断絶を防ぐコンテキスト伝搬手法
Sansan Tech Blog
この記事は、Bill One開発Unit ブログリレー2025の第21弾になります! こんにちは。技術本部 Bill One Engineering Unitの前田です。 今回は、前回の記事で宣言したとおり、非同期処理の計装について記事を書きます。今回はコンテキスト伝搬に着目しています。
4日前

VfL Wolfsburg turns ChatGPT into a club-wide capability
OpenAI News
By focusing on people, not pilots, the Bundesliga club is scaling efficiency, creativity, and knowledge—without losing its football identity.
4日前

カミナシ Tech Night #1 - AWS re:Invent 2025 Recap Specialを開催しました!
カミナシ エンジニアブログ
2026年1月28日に「カミナシ Tech Night #1 AWS re:Invent 2025 Recap Special」を開催!社内外から約15名が参加し、ALB/NLBの最新機能やキャッシュ戦略、Iceberg v3など、re:Inventの最新情報を共有しました。
4日前

Introducing Deno Sandbox Simon Willison's Weblog
<p><strong><a href="https://deno.com/blog/introducing-deno-sandbox">Introducing Deno Sandbox</a></strong></p>Here's a new hosted sandbox product from the Deno team. It's actually unrelated to Deno itself - this is part of their Deno Deploy SaaS platform. As such, you don't even need to use JavaScript to access it - you can create and execute code in a hosted sandbox using their <a href="https://pypi.org/project/deno-sandbox/">deno-sandbox</a> Pyth...
4日前

エージェント型AIの使用で仕事の満足度が向上、一方でAIツールの増加で複雑性が増しているなど。GitLabが日本国内の開発、セキュリティ、運用担当者を対象にした調査結果
Publickey
GitLab社は、日本国内でソフトウェア開発(Dev)、セキュリティ(Sec)、運用(Ops)のいずれかに携わっているITエンジニア(以下、DevSecOps専門家)3266人を対象にした、AIに関する調査結果「インテリジェントソフトウェア...
4日前

【25卒新人研修】DevOps-hands-on dev編
Recruit Data Blog
はじめに こんにちは!データ推進室 2025年度新卒の門倉・萩原です。 新人研修の様子を紹介するブログシリーズ、今回は「Dev
4日前
2/3 (火)

Radar Trends to Watch: February 2026
Radar
If you wanted any evidence that AI had colonized just about every aspect of computing, this month’s Trends would be all you need. The Programming section is largely about AI-assisted programming (or whatever you want to call it). AI also claims significant space in Security, Operations, Design, and (of course) Things. AI in the physical […]
4日前

Apollo Client の Field Policy を活用し、React コンポーネントをクリーンにする
Wantedly Engineer Blog
こんにちは、ウォンテッドリーの VIsit Social Squad というチームでソフトウェアエンジニアをしてる...
4日前

January sponsors-only newsletter is out Simon Willison's Weblog
<p>I just sent the January edition of my <a href="https://github.com/sponsors/simonw/">sponsors-only monthly newsletter</a>. If you are a sponsor (or if you start a sponsorship now) you can <a href="https://github.com/simonw-private/monthly/blob/main/2026-01-january.md">access it here</a>. In the newsletter for January:</p><ul><li>LLM predictions for 2026</li><li>Coding agents get even more attention</li><li>Clawdbot/Moltbo...
4日前

コンテナのログがDatadogに到達するまでの険しい道のり
Timee Product Team Blog
こんにちは、DevPFチームの菅原です。 現在、弊社のアプリケーション基盤(ECS on Fargate)では、コンテナログの収集・転送にFireLensを採用し、Datadog Logsへ集約しています。FireLensはタスク定義に数行記述するだけでログ基盤が整う非常に便利な機能です。一方で裏側では、Fluent Bitがサイドカーとして動作し、複雑なパイプラインを処理しています。 「ログなんて標準出力に出せば、あとは勝手に届くもの」 そう思われがちですが、実際にはアプリケーションコンテナからDatadog Logsのexplorerに表示されるまでには、いくつもの難所が存在します。今回は…
5日前

Quoting Brandon Sanderson Simon Willison's Weblog
<blockquote cite="https://www.youtube.com/watch?v=mb3uK-_QkOo&amp;t=832s"><p>This is the difference between Data and a large language model, at least the ones operating right now. Data created art because he wanted to grow. He wanted to become something. He wanted to understand. Art is the means by which we become what we want to be. [...]</p><p>The book, the painting, the film script is not the only art. It's important, but in a way it's a receipt. It's a diploma. T...
5日前

Vol. 20 認知負荷の高いコードを書いたエンジニアに起こること
Sansan Tech Blog
この記事は、Bill One開発Unit ブログリレー2025の第20弾になります。 はじめに どんなコードだったのか リリース後のフロー 1. 感謝される 2. リファクタリングのお伺いが立つ 3. "お伺い" が "催促" に変化する 4. 怒りのPR reviewが飛んでくる 何が悪かったのか まとめ Sansan技術本部ではカジュアル面談を実施しています Sansan技術本部ではカジュアル面談を実施しています はじめに Bill One Engineering Unitで経理AXサービス「Bill One」を開発している河端です。 認知負荷の高いコードを、皆さんも見たことがあると思いま…
5日前

The Sora feed philosophy
OpenAI News
Discover the Sora feed philosophy—built to spark creativity, foster connections, and keep experiences safe with personalized recommendations, parental controls, and strong guardrails.
5日前

Introducing the Codex app Simon Willison's Weblog
<p><strong><a href="https://openai.com/index/introducing-the-codex-app/">Introducing the Codex app</a></strong></p>OpenAI just released a new macOS app for their Codex coding agent. I've had a few days of preview access - it's a solid app that provides a nice UI over the capabilities of the Codex CLI agent and adds some interesting new features, most notably first-class support for <a href="https://developers.openai.com/codex/skills">Skills</a>, a...
5日前

Open VSX Begins Implementing Pre-Publish Security Checks After Repeated Supply Chain Incidents
Socket
Following multiple malicious extension incidents, Open VSX outlines new safeguards designed to catch risky uploads earlier.
5日前

A Social Network for A.I. Bots Only. No Humans Allowed. Simon Willison's Weblog
<p><strong><a href="https://www.nytimes.com/2026/02/02/technology/moltbook-ai-social-media.html?unlocked_article_code=1.JFA.kBCd.hUw-s4vvfswK&amp;smid=url-share">A Social Network for A.I. Bots Only. No Humans Allowed.</a></strong></p>I talked to Cade Metz for this New York Times piece on OpenClaw and Moltbook. Cade reached out after seeing my <a href="https://simonwillison.net/2026/Jan/30/moltbook/">blog post about that</a> from the other day....
5日前

BigQueryに会話型分析機能(Conversational Analytics)が登場。詳細な分析レポート生成、将来予測や非構造化データの分析も可能に
Publickey
Google Cloudは、同社の大規模データベースであるBigQueryの新機能として、自然言語を使ってデータを分析できる会話型分析機能(Conversational Analytics)のプレビュー公開を発表しました。 この会話型分析機...
5日前

人間よりも高速にコード生成、実行、テストを繰り返すAIエージェントに適した、高速に起動終了する安全な分離環境「Vercel Sandbox」正式リリース
Publickey
Next.jsの開発元やWebホスティングサービスのプロバイダとして知られるVercelは、人間を上回る速度でAIエージェントが高速にコードの実行やテストを繰り返し行う能力に適した、高速に起動終了する安全に分離された実行環境「Vercel ...
5日前
2/2 (月)

Measuring What Matters in the Age of AI Agents
Radar
This post first appeared on Mike Amundsen’s Signals from Our Futures Past newsletter and is being republished here with the author’s permission. We’re long past the novelty phase of AI-assisted coding. The new challenge is measurement. How do we know whether all this augmentation—Copilot, Cursor, Goose, Gemini—is actually making us better at what matters? The […]
5日前

Snowflake and OpenAI partner to bring frontier intelligence to enterprise data
OpenAI News
OpenAI and Snowflake partner in a $200M agreement to bring frontier intelligence into enterprise data, enabling AI agents and insights directly in Snowflake.
5日前

中央集権型の限界とデータメッシュの壁。Sansanのデータ分析基盤のこれまでとこれから
Sansan Tech Blog
1. はじめに こんにちは。研究開発部 Data Direction Group(以下、DDG)の永井です。 Data Direction Groupブログリレー(全6回)の最終回のブログとなります。過去にナインアウト株式会社(旧 クリエイティブサーベイ株式会社)にてデータエンジニアとしてインターンしていた際、同社のSansanグループへの参画をきっかけに現在のメンバーと強い接点ができ、縁あってジョインしました。現在は4月に入社した25卒として、全社共通のDWHや開発基盤の整備、社内データ利活用支援プロジェクトの推進などをしています。これまでのブログリレーでは、Sansan AIエージェントの…
5日前

2026年2月技術イベント予定
Sansan Tech Blog
Sansan株式会社では、技術イベントや勉強会の主催・協賛・登壇を行っています。 各イベントの詳細については、以下のリンクからご確認ください。 ※開催状況により、すでに受付を終了している場合がございます。 ※掲載している内容は公開当時の情報です。最新情報は各イベントページをご確認ください。
6日前

ヤフートップページの裏側:記事推薦システムの試行錯誤と今後の挑戦 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2023年2月27日)を現在のブログへ移管したもので、2022年11月開催の「Tech-Verse 2022」で発表したセッションを要約した内容で...
6日前

RSGT2026に参加してきました
Timee Product Team Blog
株式会社タイミーのshihorinです。 1月7〜9日に開催された「Regional Scrum Gathering Tokyo 2026(RSGT2026)」に参加してきました。 RSGTに参加するのは、昨年に続き2回目です。昨年11月に「DevEnable室(プロダクト組織運営や技術広報を担うチーム)」に異動したため、今回は組織運営や文化醸成の観点を特に意識して参加しました。 特に印象的だったセッションやOSTで得られた学び・感想を、このブログでアウトプットしてみます。 🪴コミュニティ文化を組織に根付かせる〜推進者とバトンを受け取った実践者が語るコミュニティの価値と持続可能性への道筋〜 s…
6日前

Introducing the Codex app OpenAI News
Introducing the Codex app for macOS—a command center for AI coding and software development with multiple agents, parallel workflows, and long-running tasks.
6日前

TIL: Running OpenClaw in Docker
Simon Willison's Weblog
<p><strong><a href="https://til.simonwillison.net/llms/openclaw-docker">TIL: Running OpenClaw in Docker</a></strong></p>I've been running <a href="https://openclaw.ai/">OpenClaw</a> using Docker on my Mac. Here are the first in my ongoing notes on how I set that up and the commands I'm using to administer it.</p><ul><li><a href="https://til.simonwillison.net/llms/openclaw-docker#use-their-docker-compose-configuration">Use t...
6日前

セキュリティカンファレンス「JSAC2026」に登壇してきた話
NTT docomo Business Engineers' Blog
みなさんこんにちは、イノベーションセンターの益本(@masaomi346)です。 Network Analytics for Security (以下、NA4Sec) プロジェクトのメンバーとして活動しています。 この記事では、2026年1月22日・23日に開催されたセキュリティカンファレンスJSAC2026で登壇したことについて紹介します。 ぜひ最後まで読んでみてください。 JSACについて JSAC (Joint Security Analyst Conference) はJPCERT/CCが主催するセキュリティカンファレンスで、現場のセキュリティアナリストが集い、高度化するサイバー攻撃に…
6日前

BunがZig製の高速なMarkdownパーサー搭載。HTMLへのレンダリング、GitHub Flavored Markdown対応、Reactエレメントの生成など
Publickey
オープンソースで開発されているJavaScriptランタイム「Bun」の最新バージョン「Bun v1.3.8」が公開されました。 下記はBunの作者であるJarred Sumner氏のポストです。 In the next version o...
6日前

jQuery 4.0で正式にテストされた「jQuery UI 1.14.2」が公開
Publickey
jQuery UI開発チームは、今月(2025年1月)にリリースされたばかりのjQuery 4.0で正式にテストされたjQuery UIの最新版「jQuery UI 1.14.2」の公開を発表しました。 jQuery UIはその名称から分か...
6日前
2/1 (日)

Quoting Andrej Karpathy Simon Willison's Weblog
<blockquote cite="https://twitter.com/karpathy/status/2017703360393318587"><p>Originally in 2019, GPT-2 was trained by OpenAI on 32 TPU v3 chips for 168 hours (7 days), with $8/hour/TPUv3 back then, for a total cost of approx. $43K. It achieves 0.256525 CORE score, which is an ensemble metric introduced in the DCLM paper over 22 evaluations like ARC/MMLU/etc.</p><p>As of the last few improvements merged into nanochat (many of them originating in modded-nanogpt repo), I c...
7日前

GlassWorm Loader Hits Open VSX via Developer Account Compromise
Socket
Threat actors compromised four oorzc Open VSX extensions with more than 22,000 downloads, pushing malicious versions that install a staged loader, evade Russian-locale systems, pull C2 from Solana memos, and steal macOS credentials and wallets.
7日前








