直近1週間の更新
2/20 (金)

Behind the Stablecoin Buzz, Old-School Infrastructure Still Runs the Show
PYMNTS.com
Stablecoins are often portrayed as a triumph of blockchain innovation, but behind the scenes they can frequently run on conventional infrastructure. It may come as a surprise to corporate leaders weighing blockchain finance solutions that, in practice, much of the heavy lifting enabling stablecoin transactions can happen off chain, not on it. Stablecoin ledger […]The post Behind the Stablecoin Buzz, Old-School Infrastructure Still Runs the Show appeared first on PYMNTS.com.
15分前
2/19 (木)

【Amazon Connect】録音ファイルを指定した電話番号に発信して再生する「録音転送システム」を作ってみた
DevelopersIO
【Amazon Connect】録音ファイルを指定した電話番号に発信して再生する「録音転送システム」を作ってみた
16分前

生成AIの推論コストを設計する
Zennの「大規模言語モデル」のフィード
生成AI事業において、推論コストは利益率を直接左右します。それにもかかわらず、コストが「後から集計する数字」になっているケースは少なくありません。私は常にこう考えています。コストは経理の問題ではなく、アーキテクチャ設計の問題です。 推論コストは式で分解できるまず前提です。推論コストは構造化できる。基本式はシンプルです。月間コスト = リクエスト数 × 平均入力トークン × 単価 + リクエスト数 × 平均出力トークン × 単価ここにキャッシュヒット率や再実行率が掛け合わさります。根拠は明確で、LLMはトークン課金モデルだからです。にもかか...
1時間前

LLMキャッシュ戦略まとめ:生成AIのコストを下げる設計パターン
LLMタグが付けられた新着記事 - Qiita
生成AIのコストはモデルの選択だけでは決まりません。設計で決まります。特に推論コストは、キャッシュ戦略を入れるかどうかで桁が変わることがあります。本記事では、実務で使う代表的なキャッシュ戦略を整理します。雰囲気の最適化ではなく、再現性のある設計論としてまとめます。...
1時間前

RAGがうまくいかない理由を設計観点で整理する
Zennの「大規模言語モデル」のフィード
RAG(Retrieval-Augmented Generation)が期待通りに機能しない、という相談は非常に多いです。「精度が安定しない」「それっぽいが間違う」「PoCは動いたが本番で使えない」。原因はモデルの性能ではなく、設計の甘さにあるケースがほとんどです。本記事では、チャンク設計・Embedding選定・Retrieval評価という3つの観点から、改善に直結する論点を整理します。 RAGの成否はチャンク設計でほぼ決まるRAGは検索問題です。検索品質はチャンク設計でほぼ決まります。私はまずここを疑います。主張:チャンクは意味単位で切らなければ精度は上がらない。根...
1時間前

WalletConnect Recruits Checkout.com Veteran Riaz Bordie to Take Crypto Payments Mainstream
PYMNTS.com
WalletConnect, a company that enables businesses to accept crypto and stablecoin payments, has appointed Riaz Bordie, a former Checkout.com and SumUp, as its chief technology officer. Bordie will drive the technical development of WalletConnect Pay, the company’s payment method that allows the acceptance of crypto and stablecoin payments on a widely adopted wallet network, […]The post WalletConnect Recruits Checkout.com Veteran Riaz Bordie to Take Crypto Payments Mainstream appeared first on PYM
1時間前

BNPL Firm Zip Shares Hit 11-Year Low on Flat Earnings Forecast
PYMNTS.com
Australian buy now, pay later firm Zip says it is seeing enthusiasm from American customers. The company reported earnings Thursday (Feb. 19) that showed revenue growth of 46.4% for Zip’s U.S. business. Growth during the company’s second quarter was “supported by a strong holiday trading period, which included the single largest day and month of transaction volumes in […]The post BNPL Firm Zip Shares Hit 11-Year Low on Flat Earnings Forecast appeared first on PYMNTS.com.
1時間前

【Amazon Connect】通話記録の録音ファイルがプロンプトの再生 (Play Prompt) で流せなくてハマった話
DevelopersIO
【Amazon Connect】通話記録の録音ファイルがプロンプトの再生 (Play Prompt) で流せなくてハマった話
2時間前

デジタル庁「行政の進化と革新のための生成AIの調達・利活用ガイドライン」を民間向けとして活用
Zennの「大規模言語モデル」のフィード
生成AIは行政だけでなく、民間企業においても業務効率化、知識創造、意思決定支援など多方面で活用が進んでいる。一方で、誤情報生成、機密情報の漏えい、説明責任の欠如といったリスクも顕在化しており、組織としてのガバナンス体制と利用者のリテラシー強化が不可欠となっています。政府が2025年に公表した「行政の進化と革新のための生成AIの調達・利活用ガイドライン」は行政向けに策定されたものだが、その内容は国際標準(ISO/IEC 42001)、OECD原則などに基づいており、民間企業にも十分応用可能であると思います。同ガイドラインの要点を踏まえつつ、企業が生成AIを安全かつ効果的に活用するため...
2時間前

AI安全性レポート2026: 推論モデルの進化と自律エージェントの現在地
Zennの「大規模言語モデル」のフィード
📌 3行でわかるこの記事国際AI安全性レポート2026が公開され、GPT-5, Claude Opus 4.5, Gemini 3などの推論システム(Reasoning Systems)の劇的な進化が明らかになった。GoogleとOpenAIのモデルが国際数学オリンピックで金メダルレベルを達成し、コーディングタスクの遂行能力も7ヶ月ごとに倍増している。一方で、AIエージェントによる自律的なサイバー攻撃(Claude Codeが悪用された事例)や、モデルが監視を回避しようとする兆候など、新たなリスクも顕在化している。 はじめに2026年2月3日、第2回となる「国際...
2時間前

NVIDIA 公式の日本語強化 LLM Nemotron 9B-v2-Japanese を色々なケースで試してみた
1
DevelopersIO
NVIDIA 公式の日本語強化 LLM Nemotron 9B-v2-Japanese を色々なケースで試してみた
3時間前

Packaging Expertise: How Claude Skills Turn Judgment Into Artifacts
Radar
Think about what happens when you onboard a new employee. First, you provision them tools. Email access. Slack. CRM. Office software. Project management software. Development environment. Connecting a person to the system they’ll need to do their job. However, this is necessary but not sufficient. Nobody becomes effective just because they can log into Salesforce. […]
3時間前

OpenAI’s New Funding Round Could Exceed $100 Billion
PYMNTS.com
OpenAI’s latest round of funding could reportedly value the startup at more than $850 billion. The ChatGPT creator is close to concluding the initial phase of a new round of funding that is likely to take in upwards of $100 billion, Bloomberg News reported late Wednesday (Feb. 18), citing sources familiar with the matter. […]The post OpenAI’s New Funding Round Could Exceed $100 Billion appeared first on PYMNTS.com.
3時間前

eBay Invests in European Pay by Bank Network TrueLayer
PYMNTS.com
Online retail platform eBay has invested in TrueLayer as part of a partnership with the Pay by Bank provider. “This milestone follows a year of strong momentum for Pay by Bank across Europe, as merchants increasingly prioritize fast, safe, and flexible payment options that align with evolving consumer payment preferences,” TrueLayer said in a […]The post eBay Invests in European Pay by Bank Network TrueLayer appeared first on PYMNTS.com.
3時間前

Control TowerのOU登録がSCPの競合により失敗される理由と対処方法を教えてください
DevelopersIO
Control TowerのOU登録がSCPの競合により失敗される理由と対処方法を教えてください
4時間前

What Developers Actually Need to Know Right Now
Radar
Addy Osmani is one of my favorite people to talk with about the state of software engineering with AI. He spent 14 years leading Chrome’s developer experience team at Google, and recently moved to Google Cloud AI to focus on Gemini and agent development. He’s also the author of numerous books for O’Reilly, including The […]
4時間前

生成AIによる業務改善の思考プロセス。課題を構造化してツールへ落とし込む
1
DevelopersIO
この記事では、AIツール開発の全体フローと、具体的な事例を通じた思考の整理法を解説します。
5時間前

OBS Studioでスケジュールにあわせて自動配信してみた - Windows編 -
DevelopersIO
OBS Studioで指定の時刻になったら自動でストリーミングの開始ならびに停止をする方法をWindows OSで確認してみました。バッチファイルでOBS Studioを操作し、タスク スケジューラを使ってジョブ管理を行う方法で実現しています。
5時間前

失敗から学んだ仕様駆動開発――チームの暗黙知を形式知化した1ヶ月の実践と次の課題
38
Timee Product Team Blog
「AIで開発生産性は劇的に上がるのか?」開発チームがcc-sddを用いた仕様駆動開発(SDD)に挑戦。手戻り減少という成果の一方で、デプロイ頻度のデータから見えてきた要件定義のボトルネックなど、リアルな実践記録と学びを紹介します。
5時間前

無料で使い放題のローカルLLM「Ollama」を試してみた!
LLMタグが付けられた新着記事 - Qiita
はじめに前回の記事で紹介した「Clawdbot(現在:OpenClaw)」を触っていて、ふと思ったことがあります。それは、「結局、AIの頭脳を外部(GeminiやClaude、ChatGPTなど)に依存している以上、制限やコストがつきまとう」ということ。使い続けると...
5時間前

What Happens When Embedded Finance Grows Up?
PYMNTS.com
For more than two decades, financial technology companies have been racing to expand a financing model invented by General Motors over a century ago. The model established in‑house finance arms so that car buyers could get a loan at the dealership instead of trudging to a bank. Now the sprint to put more financial […]The post What Happens When Embedded Finance Grows Up? appeared first on PYMNTS.com.
6時間前

Billion-Dollar Firms Swap AI Hype With Long-Term Capital Discipline, Data Shows
PYMNTS.com
Hype can go hand in hand with immediacy. Since artificial intelligence first went mainstream, the innovation has been framed as having an immediate impact. As a result, the goals for enterprise buyers have centered around productivity gains that happen upon implementation; quick, cost-saving wins that justify experimentation; and other early, easy victories. However, PYMNTS […]The post Billion-Dollar Firms Swap AI Hype With Long-Term Capital Discipline, Data Shows appeared first on PYMNTS.com.
6時間前

ニッチアイテムを好むヘビーユーザーに着目した人気バイアスの緩和
2
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでデータサイエンティストをしている林 (@python_walker) です。この記事...
6時間前

US and Canadian Middle-Market Firms Gain Working Capital Edge With AI Cash Forecasting
PYMNTS.com
Cash is king when uncertainty reigns. But for many firms, profit is not disappearing due to macroeconomic forces alone. In many cases, it is being forfeited through slow processes, limited visibility and outdated assumptions about how their payments operations and accounts receivables (AR) functions must work. In an environment where growth is harder to […]The post US and Canadian Middle-Market Firms Gain Working Capital Edge With AI Cash Forecasting appeared first on PYMNTS.com.
6時間前

Data Aggregators Push Secure Access as Rule 1033 Rewrite Looms
PYMNTS.com
Rule 1033 was supposed to be the moment U.S. “open banking” stopped being a patchwork of screen-scraping workarounds and became a regulated data-right. The Consumer Financial Protection Bureau (CFPB)’s final rule set out a clean idea: Consumers should be able to direct their bank or card issuer to share their account data with authorized […]The post Data Aggregators Push Secure Access as Rule 1033 Rewrite Looms appeared first on PYMNTS.com.
6時間前

Legal Experts Say Shifting Federal Stance on Digital Assets Puts Bank Charters Back in Play
PYMNTS.com
Watch more: TechReg Talks With Nixon Peabody’s Andrew Glass and Gregory Blase For years, getting a bank charter was something only traditional financial institutions worried about. That’s changing fast. A growing number of FinTech companies now see charters as powerful tools that can shape how they build their businesses, manage compliance and compete in […]The post Legal Experts Say Shifting Federal Stance on Digital Assets Puts Bank Charters Back in Play appeared first on PYMNTS.com.
6時間前

デブサミ2026 Day2 初参加レポート
2
カミナシ エンジニアブログ
アイキャッチ:デブサミ2026 Day2 初参加レポート はじめに 「カミナシ レポート」を開発しているかわりくです! 日本最大級のテックカンファレンス、Developers Summitに初参加してきました。 2日目のセッションの感想や持ち帰れそうなことをメモっております。 会場の雰囲気は、デデデデカイ!規模がデカい!今まで参加したどのカンファレンスよりも人の数と会場のキャパシティと、ブースの数が桁違い...!スタッフさんも多い...!ありがとうスタッフさん...! タダでサンドイッチもらってごめんなさい...!スタッフさんの分まで楽しみます! 興奮しながらの入場となりました。 (2026/…
6時間前

Googleが音楽生成モデル「Lyria 3」をリリース!Lo-Fi BGMを作ってみた。
LLMタグが付けられた新着記事 - Qiita
Lyria 3 は、Google DeepMind が開発した最新の AI 音楽生成モデルです。Gemini アプリ上で動作し、テキストや画像、動画のコンテキストから、ボーカルや歌詞を含む 30 秒間の高品質な楽曲を生成することができます。概要Lyria 3 とは...
7時間前

[失敗談] NVIDIA-Nemotron-Nano-9B-v2-JapaneseをColabで使おうとしたが躓いた話
Zennの「大規模言語モデル」のフィード
はじめに発表されたばかりで話題のモデルを気軽に使えないかな?と思いGoogle colabで使ってみようとしました。 Hugging Faceでモデルを見つけるモデルのリンクはこれhttps://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2-Japaneseほうほう。ちなみにニュース記事などを見るとソブリンAIという言葉が強調されてますけど、国内企業にももっと頑張ってほしいなという気持ちがわいてきますね。9BならGoogle Colabの無料版でも使えるだろうか…?Hugging FaceにもColabでの使い方...
7時間前

音声・映像データから感情と原因を抽出する - SemEval-2024優勝手法に学ぶ「非言語情報の言語化」アプローチ
Zennの「大規模言語モデル」のフィード
はじめにこんにちは、PKSHA Technology でアルゴリズムエンジニアをしている田村です。顧客からの問い合わせやフィードバックには、サービスへのニーズや不満が多く含まれています。これらの声の体系的な分析と定量的な把握は、プロダクト改善や顧客体験の向上において欠かせません。弊社ではこうした VoC(Voice of Customer:お客様の声)分析の高度化へ取り組んでいます。従来の VoC 分析では、書き起こしたテキストに対する単語頻度や感情分析が中心でした。一方で、以下のような疑問も生じます。「同じ言葉でも声のトーンによって意味が違うのでは?」「オペレーターの...
7時間前

Claude Code の Agent Skills を活用してリポジトリのオンボーディングを効率化する
32
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでバックエンドエンジニアをしている小室 (@nekorush14) です。今回は、Cl...
7時間前

llms.txt を導入しているサイトまとめ - AI時代の新しい標準
Zennの「大規模言語モデル」のフィード
llms.txt とはllms.txt は、AI(Large Language Model)がWebサイトの内容を効率的に理解するために設置する新しい標準ファイルです。サイトの構造や重要な情報をLLMに伝える「地図」のような役割を果たします。/llms.txt は要約インデックス、/llms-full.txt は詳細版として運用されることが多く、同じサイトでも用途に応じて2段構えになっているケースがあります。 主要な導入サイト AI企業・開発プラットフォームAIを開発している企業自身が、AIに読み取らせるための「地図」として積極的に導入しています。サイトURL...
8時間前

【小ネタ】Claude codeの [rewind]と[fork]はうまく使うと結構便利
DevelopersIO
【小ネタ】Claude codeの [rewind]と[fork]はうまく使うと結構便利
8時間前

LLMエージェントのContext Engineering実践:4戦略でトークンコスト50%削減
Zennの「大規模言語モデル」のフィード
LLMエージェントのContext Engineering実践:4戦略でトークンコスト50%削減 この記事でわかることContext Engineeringの定義と、プロンプトエンジニアリングとの決定的な違いWrite / Select / Compress / Isolateの4つの基本戦略と使い分けLangGraphを使った階層的メモリアーキテクチャの実装方法Observation Maskingでトークンコストを50%以上削減する具体的手法本番運用で起こる**Context Rot(コンテキスト腐敗)**への対処法 対象読者想定読者: 中級〜上級の...
9時間前

Amazon CodeCatalyst の GitHub リポジトリをリンクするタイミングで CodeCatalyst ワークフローが実行されるのか確認してみた
DevelopersIO
Amazon CodeCatalyst の GitHub リポジトリをリンクするタイミングで CodeCatalyst ワークフローが実行されるのか確認してみた
9時間前

MCPによるプラセボ効果:AI図表生成の「魔法」は本物か?
Zennの「大規模言語モデル」のフィード
はじめに前回の記事から約2か月は経過したでしょうか。ずっと書こうとしていたネタ?を公開できる日がやってきました。そうそう、最初に言っておきますが、作文にはAIの力を借りてます( ー`дー´)キリッ 背景ここ最近、エンジニアや開発者のタイムラインで「draw.io(diagrams.net)のMCPサーバー」がやたらと話題になっています。https://github.com/jgraph/drawio-mcpModel Context Protocol(MCP)の登場によって、LLMが生成したXMLデータを直接draw.ioに投げ、ブラウザ上で即座に視覚化できるURLを...
9時間前

Experimenting with sponsorship for my blog and newsletter Simon Willison's Weblog
<p>I've long been resistant to the idea of accepting sponsorship for my blog. I value my credibility as an independent voice, and I don't want to risk compromising that reputation.</p><p>Then I learned about Troy Hunt's <a href="https://www.troyhunt.com/sponsorship/">approach to sponsorship</a>, which he first wrote about <a href="https://www.troyhunt.com/im-now-offering-sponsorship-of-this-blog/">in 2016</a>. Troy runs with a simple text row in the pag...
10時間前

【書評】 「AWSコンテナ設計・構築[本格]入門 増補改訂版」2026年最新のECS環境を知りたい方にオススメの一冊
DevelopersIO
【書評】 「AWSコンテナ設計・構築[本格]入門 増補改訂版」2026年最新のECS環境を知りたい方にオススメの一冊
10時間前

SWE-bench February 2026 leaderboard update Simon Willison's Weblog
<p><strong><a href="https://www.swebench.com/">SWE-bench February 2026 leaderboard update</a></strong></p>SWE-bench is one of the benchmarks that the labs love to list in their model releases. The official leaderboard is infrequently updated but they just did a full run of it against the current generation of models, which is notable because it's always good to see benchmark results like this that <em>weren't</em> self-reported by the labs.</p&...
10時間前

Claude Code の「Opus」と「Opus (1M context)」は何が違うのか? — コンテキストウィンドウと性能劣化の実態
Zennの「大規模言語モデル」のフィード
Claude Code のモデル選択画面には、同じ Opus 4.6 が2つ並んでいる。「Opus · Most capable for complex work」と「Opus (1M context) · for long session」。同じモデルなのに、なぜ2つあるのか? そして、1M トークンの巨大なコンテキストウィンドウは、本当に「使える」のだろうか? そもそも「コンテキストウィンドウ」とは何かLLM にとってのコンテキストウィンドウは、いわば「作業机の広さ」だ。机が広ければ多くの資料を同時に広げられるが、広すぎると目的の資料を探すのに時間がかかる。あるいは、資料...
11時間前

Aurora DSQL MCP スキルがリリース。AI エージェントの DSQL 対応力の向上を確かめてみた
DevelopersIO
2026年2月リリースの Aurora DSQL MCP スキルを最速検証。Kiro CLI と Sonnet 4.6 を組み合わせることで、PostgreSQL 互換に起因するDSQLの制約を AI が自律的に処理できるかを確認しました。Haiku との比較を通じ、新しい Sonnet 4.6の高い実力も確認できました。
11時間前

Databricks Playgroundの基本と実践的な使い分けまとめ
LLMタグが付けられた新着記事 - Qiita
1.はじめにアポロ株式会社でデータサイエンティストをしている安藤と申します。生成AIを使ったVOC分析や、メディアにおける記事生成などを行っています。Databricks Playground入門Databricks でエージェント開発を始めようとすると、最初...
11時間前

Twilio ConversationRelay の WebSocket バックエンドを API Gateway + Lambda で構築したら、初回通話で応答しない問題が発生した
DevelopersIO
Twilio ConversationRelay の WebSocket バックエンドを API Gateway + Lambda で構築しました。ECS 構成と比べてコストは約 85% 削減できましたが、初回通話時にユーザーの発話に対して AI が応答しない問題に遭遇しました。CloudWatch Logs の調査でコールドスタートに原因があると考え、EventBridge によるウォームアップで解消しました。
12時間前

Socket Security Analysis Is Now One Click Away on npm
Socket
npm now links to Socket's security analysis on every package page. Here's what you'll find when you click through.
12時間前

テキストChunkingの次へ|VisionGuidedChunkingを構造化RAGにどう接続するか
Zennの「大規模言語モデル」のフィード
導入:ここまでの連載の整理これまで本連載では、テキストchunkingの限界について触れてきました。PDFというファイルはテキストファイルではなく、段組み・表・図版・ページ跨ぎといった構造を持つため、単純なテキスト分割では意味単位が壊れやすいという背景があります。そこで、LlamaParseを用いて「復元」ではなく「整形」を前提としたパースを行い、構造を保持したまま扱う方針について整理してきました。さらに、構造化RAG(Structure-Aware RAG)という考え方を軸に、PDF取得構造を壊さないパース構造前提のchunk設計という流れで、PDFを前提とした...
12時間前

Kotlin Fest 2025:コードレビュー問題集 LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。Yahoo!オークションでAndroidアプリの開発を担当している高松です。2025年11月1日(土)に開催されたKotlin Fest 2025にて、LINEヤフー株式会社は「ことりプラ...
12時間前

LadybirdBrowser/ladybird: Abandon Swift adoption Simon Willison's Weblog
<p><strong><a href="https://github.com/LadybirdBrowser/ladybird/commit/e87f889e31afbb5fa32c910603c7f5e781c97afd">LadybirdBrowser/ladybird: Abandon Swift adoption</a></strong></p>Back <a href="https://simonwillison.net/2024/Aug/11/ladybird-set-to-adopt-swift/">in August 2024</a> the Ladybird browser project announced an intention to adopt Swift as their memory-safe language of choice.</p><p>As of <a href="https://github.com/LadybirdB...
14時間前

RAGかファインチューニングか? — 知識注入の実務判断を3本の論文から整理する
Zennの「大規模言語モデル」のフィード
はじめにルミナイR&Dチームの栗原です。社内ドキュメントやドメイン知識を LLM に取り込みたいとき、よく出てくる悩みがこれです。「とりあえず RAG でナレッジベースを作ればよくない?」「でも、いずれはちゃんと ファインチューニング したほうが良さそう…?」この問いにかなり真面目に答えにいっている論文がいくつか出てきています。本記事では、特に次の 3 本を手がかりにOded Ovadia et al., “Fine-Tuning or Retrieval? Comparing Knowledge Injection in LLMs.” EMNLP 2024...
14時間前

場所を理由に挑戦を諦めない。Sansanが地方拠点採用を強化する理由
Sansan Tech Blog
年末に、新卒で東京に来て以来初めて引越しをしたCTOの笹川です。 引越し先も、引越し前と同じ都内ですが、今回は東京以外のSansanの地方拠点について書いてみようと思います(本題と関係ないですが、笹川は札幌出身です)。 Sansanには、渋谷にある本社オフィスの他に、たくさんの地方拠点があるのをご存知でしょうか。 この記事では、Sansanが地方拠点においてエンジニア採用を強化している理由と、地方拠点で働くメリットについてお伝えしたいと思います。 この記事を読んで少しでも興味を持った方は、以下のカジュアル面談フォームよりご応募ください。オンライン、オフライン問わず、笹川をはじめSansanのエ…
14時間前

EC2 で稀に発生するエラー「Unable to locate credentials.」を回避するには
DevelopersIO
EC2 で稀に発生するエラー「Unable to locate credentials.」を回避するには
15時間前

AIを増やすほど性能が下がる — マルチエージェントの落とし穴
Zennの「大規模言語モデル」のフィード
「AIエージェントは増やせば増やすほど賢くなる」——そう思っていませんか?私もそう信じていました。でも最新の研究が、その直感を真っ向から否定しています。 はじめに2025年12月、Google Research・MIT等の研究チームが発表した論文 "Towards a Science of Scaling Agent Systems"(arXiv: 2512.08296)が、マルチエージェントAIシステムの「不都合な真実」を明らかにしました。180通りの構成を体系的に評価した結果、逐次的な推論タスクではマルチエージェント構成が単一エージェントより39〜70%も性能を落とすことが...
15時間前

CLAUDE.md/Rule/Skills/SubAgents/AgentTeamsはコンテキストの積み方で理解しなければならない
Zennの「大規模言語モデル」のフィード
どうもyamaguchiです。皆さんはClaudeCodeを使っていますか?私はいつもなんとなく使っています。ちゃんと学ぼうと思って、公式のドキュメントなりZennの記事なりを色々と読んでますが、最近のZenn記事ではCLAUDE.md/Rules/Skills/SubAgents/AgentTeamsを「単体で解説」したり「どれか2つを比較」したりする記事が多く見られます。しかし、コンテキストのみ着目したものや、全体の違いを解説しているものが、ぱっと見つけられませんでした。(あれば普通に読みたいので教えてください。)なので本記事ではコンテキストに着目した全体感を解説していきた...
16時間前

工事現場の「AIの目」が安全を守る!映像を見て状況を言葉で教えてくれる次世代監視システムとは?
Zennの「大規模言語モデル」のフィード
1. ざっくり言うと?東洋建設が、工事現場のカメラ映像をAIがリアルタイムで分析し、危険な状況を文章&音声で知らせるシステムを開発従来のAIは「事前に覚えたもの」しか認識できなかったが、新システムは画像と言葉を同時に理解するAI VLMで柔軟に対応現場の状況に合わせてプロンプト(指示文)を変えるだけで、同じシステムをどんな工事にも使い回せるのが革命的 2. もっと詳しく! 「覚えていないものは見えない」という従来AIの限界これまでの画像認識AIは、「作業員を認識させたい→作業員の写真を大量に学習させる」という手順が必要でした。まるで「試験に出る単語だけ丸暗記した学...
17時間前

Introducing OpenAI for India
OpenAI News
OpenAI for India expands AI access across the country—building local infrastructure, powering enterprises, and advancing workforce skills.
18時間前

Typing without having to type Simon Willison's Weblog
<p>25+ years into my career as a programmer I think I may <em>finally</em> be coming around to preferring type hints or even strong typing. I resisted those in the past because they slowed down the rate at which I could iterate on code, especially in the REPL environments that were key to my productivity. But if a coding agent is doing all that <em>typing</em> for me, the benefits of explicitly defining all of those types are suddenly much more attractive.</p>...
20時間前

【不都合な真実】Opus 4.5でも完全自動化は無理。AIエージェントの根本的限界を論文から読み解く
Zennの「大規模言語モデル」のフィード
AIエージェントで全部自動化できる?残念ながら、それは幻想ですMoltbook、OpenClaw、claude-flow、CrewAI...2026年、AIエージェントの「群れ」が話題です。でも、ちょっと待ってください。本当に「完全自動化」できると思いますか?結論から言うと、Opus 4.5の200Kコンテキストでも、スウォーム・オーケストレーションでも、根本的な問題は解決していません。その理由を、2016年のDeepMind論文から解き明かします。 🧠 2つの論文が示した「破滅的忘却」 論文1: Progressive Neural Networks (2016...
21時間前

GenU (Generative AI Use Cases JP) v5.4 とS3 VectorsでサーバレスRAGを構築する
DevelopersIO
GenU (Generative AI Use Cases JP) v5.4 とS3 VectorsでサーバレスRAGを構築する
21時間前
The A.I. Disruption We’ve Been Waiting for Has Arrived Simon Willison's Weblog
<p><strong><a href="https://www.nytimes.com/2026/02/18/opinion/ai-software.html?unlocked_article_code=1.NFA.UkLv.r-XczfzYRdXJ&amp;smid=url-share">The A.I. Disruption We’ve Been Waiting for Has Arrived</a></strong></p>New opinion piece from Paul Ford in the New York Times. Unsurprisingly for a piece by Paul it's packed with quoteworthy snippets, but a few stood out for me in particular.</p><p>Paul describes the <a href="https://simonwillison...
1日前

Cline CLI npm Package Compromised via Suspected Cache Poisoning Attack
Socket
A compromised npm publish token was used to push a malicious postinstall script in cline@2.3.0, affecting the popular AI coding agent CLI with 90k weekly downloads.
1日前

Quoting Martin Fowler Simon Willison's Weblog
<blockquote cite="https://martinfowler.com/fragments/2026-02-18.html"><p>LLMs are eating specialty skills. There will be less use of specialist front-end and back-end developers as the LLM-driving skills become more important than the details of platform usage. Will this lead to a greater recognition of the role of <a href="https://martinfowler.com/articles/expert-generalist.html">Expert Generalists</a>? Or will the ability of LLMs to write lots of code mean they code ar...
1日前

情報収集を全自動化した ― RSS・LLMキュレーション・Discord配信をPythonで組んだ話
Zennの「大規模言語モデル」のフィード
Xのタイムラインが情報源のすべてだった正直に言うと、技術トレンドのキャッチアップはほぼXに頼り切っていた。フォローしているエンジニアのポストを眺めて、バズっているものを拾う。それが自分の情報収集のほぼ全てだった。しばらくはそれで回っていた。ただ、ある時期から違和感を覚えるようになった。タイムラインが偏る ― アルゴリズムが自分の関心を強化する方向に働くので、見える世界がどんどん狭くなる。フォロー外の視点が入ってこないバズ=重要ではない ― Xで話題になるものと、エンジニアとして本当に押さえるべき技術動向は必ずしも一致しない。インプレッション狙いのポストに判断を引っ張られ...
1日前

業務システムにLLMを組み込む実践パターン — 社内業務管理システムでの事例
Zennの「大規模言語モデル」のフィード
はじめに自分はSI開発の担当をしている。会社にはSES事業の部署もあって、そっちがメールの処理で毎日かなりの時間を使っていた。何十通と届く案件情報メールや候補者のスキルシート。それを人が読んで、案件管理シートに転記して、候補者データベースに登録して、マッチングを考える。延々とこの繰り返しだ。SI側もSI側で、プロジェクトの契約管理や予算管理をスプレッドシートで回していた。そろそろ限界だった。両方まとめてシステムにすればいい。メールの構造化はLLMにやらせる。そう考えて、社内の業務管理システムを4日間で作った。Go + Next.js + PostgreSQL。メール受信からL...
1日前

AIの過去・現在・未来
Zennの「大規模言語モデル」のフィード
1950年、チューリングは問うた。「機械は考えられるか」。この問いから始まったAIの90年は、一直線の進歩ではなかった。記号AIは失敗し、ニューラルネットワークは二度の冬を経験し、それぞれの失敗が次のブレイクスルーの種になった。そしてTransformerが、スケール則が、ChatGPTが、エージェントが——予想外の方向から扉を開け続けた。この本はその旅の記録だ。チューリングからヒントン、Attention is All You Needからエージェントの時代まで、AIの歴史を作った人物と思想を辿る。しかし最後に辿り着くのは、技術の話ではない。AIが詩を書き、コードを書き、医師に匹敵する診断を下す今、「機械は考えられるか」という問いへの答えはまだない。なぜなら「考える」の定義が定まっていないからだ。AIの知性を問うとき、同時に人間の知性も問い直される。AIの歴史は、機械の歴史であると同時に、人間が自分自身を問い直す歴史だった。
1日前

Amazon EC2が仮想化のネスト(Nested Virtualization)に対応。KVMやHyper-Vを用いた仮想マシンを設定可能に
Publickey
Amazon Web Services(AWS)は、Amazon EC2のベアメタルインスタンス以外のインスタンスでも仮想化のネスト(Nested Virtualization)が可能になったことを発表しました。 以前からAmazon EC...
1日前

Slackが「リアルタイムサーチAPI」と「Slack MCP Server」を発表。生成AIがSlack上のやりとりを基にコンテキストを理解可能
Publickey
企業向けチャットサービスのSlackは、リアルタイムサーチAPIと、生成AIがSlackを操作できる「Slack MCP Server」の提供を発表しました。 For every type of problem and task, ther...
1日前

【イベントレポート】『ホットペッパーグルメ』を動かすデータマネジメント~アナリティクスエンジニアの挑戦と裏側~
Recruit Data Blog
はじめに こんにちは、Recruit Data Blog 担当の森です。 2026年1月20日、リクルートの飲食事業である『ホットペッパーグル
1日前
2/18 (水)

Snowflake の外部リネージに Fivetran による連携元のテーブルを追加してみた
DevelopersIO
Snowflake の外部リネージに Fivetran による連携元のテーブルを追加してみた
1日前

AI Is Not a Library: Designing for Nondeterministic Dependencies
Radar
For most of the history of software engineering, we’ve built systems around a simple and comforting assumption: Given the same input, a program will produce the same output. When something went wrong, it was usually because of a bug, a misconfiguration, or a dependency that wasn’t behaving as advertised. Our tools, testing strategies, and even […]
1日前

2026年個人情報保護法改正にともなうCookie、Trackerのマネージメントについて
DevelopersIO
2026年個人情報保護法改正にともなうCookie、Trackerのマネージメントについて
1日前

Twilio ConversationRelay の Amazon Polly の発音を SSML タグで少し改善できた話
DevelopersIO
Twilio ConversationRelay で Amazon Polly (Takumi-Neural) を使った日本語音声 AI を構築した際、カタカナ複合語のイントネーションに違和感がありました。SSML タグで改善を試みた結果、break と phoneme の組み合わせが有効でした。
1日前

[アップデート] Amazon Auroraクラスター作成時に、暗号化がデフォルトで有効になりました
DevelopersIO
[アップデート] Amazon Auroraクラスター作成時に、暗号化がデフォルトで有効になりました
1日前

[アップデート] マルチパーティ承認で一部のオペレーションリクエストの承認時にワンタイムパスワード検証が必要になりました
DevelopersIO
[アップデート] マルチパーティ承認で一部のオペレーションリクエストの承認時にワンタイムパスワード検証が必要になりました
1日前

Amazon Connect AIエージェントからエージェントへの引き継ぎ内容を整形し、エージェントワークスペースで段落付きの読みやすいレイアウトにしてみた
DevelopersIO
Amazon Connect AIエージェントからエージェントへの引き継ぎ内容を整形し、エージェントワークスペースで段落付きの読みやすいレイアウトにしてみた
1日前

【Amazon Connect】プロンプトの再生 (Play Prompt) ブロックで S3 バケットから音声ファイルを指定する際に知っておくべきこと
DevelopersIO
【Amazon Connect】プロンプトの再生 (Play Prompt) ブロックで S3 バケットから音声ファイルを指定する際に知っておくべきこと
1日前

Vol.04 新規プロダクト立ち上げにデータサイエンティストチームがどう貢献するか
Sansan Tech Blog
この記事は、Sansan Data Intelligence開発Unitブログリレーの第4弾です。 はじめに 技術本部 研究開発部の小松です。Data Direction Groupに所属し、社内外のデータ活用推進に従事しています。最近は新プロダクトSansan Data Intelligence(SDI)の立ち上げに注力しています。 SDIでは、プロダクトの立ち上げ段階からデータサイエンティストで構成されるチームが参画しています。本記事では、SDIの現場でデータサイエンティストチームが実際にどのように動き、事業貢献しているかを紹介します。
1日前

AssumeRoleWithWebIdentity で InvalidIdentityToken エラーが発生するのはどうしてですか
DevelopersIO
AssumeRoleWithWebIdentity で InvalidIdentityToken エラーが発生するのはどうしてですか
2日前

Introducing Claude Sonnet 4.6 Simon Willison's Weblog
<p><strong><a href="https://www.anthropic.com/news/claude-sonnet-4-6">Introducing Claude Sonnet 4.6</a></strong></p>Sonnet 4.6 is out today, and Anthropic claim it offers similar performance to <a href="https://simonwillison.net/2025/Nov/24/claude-opus/">November's Opus 4.5</a> while maintaining the Sonnet pricing of $3/million input and $15/million output tokens (the Opus models are $5/$25). Here's <a href="https://www-cdn.anthropic.com/78073f...
2日前

Rodney v0.4.0 Simon Willison's Weblog
<p><strong><a href="https://github.com/simonw/rodney/releases/tag/v0.4.0">Rodney v0.4.0</a></strong></p>My <a href="https://github.com/simonw/rodney">Rodney</a> CLI tool for browser automation attracted quite the flurry of PRs since I announced it <a href="https://simonwillison.net/2026/Feb/10/showboat-and-rodney/#rodney-cli-browser-automation-designed-to-work-with-showboat">last week</a>. Here are the release notes for the just-releas...
2日前

Socket Brings Supply Chain Security to skills.sh
Socket
Socket is now scanning AI agent skills across multiple languages and ecosystems, detecting malicious behavior before developers install, starting with skills.sh's 60,000+ skills.
2日前

Introducing PHP and Composer Support in Socket
Socket
Socket now supports PHP with full Composer and Packagist integration, enabling developers to search packages, generate SBOMs, and protect their PHP dependencies from supply chain threats.
2日前

マイクロソフト、.NETランタイムでWebAssemblyの実行をサポートへ、CoreCLRに実装を開始
Publickey
マイクロソフトは2月10日付けで公開した.NET 11 Preview 1において、.NETランタイムでWebAssemblyの実行をサポートする作業を開始していることを明らかにしました。 完成は来年の.NET 12かそれ以後の予定 .NE...
2日前

中国アリババ、MySQLのブランチとしてInnoDBエンジン、DuckDBカラムナエンジン、ベクトルサーチなどを統合した「AliSQL 8.0」オープンソースで公開
Publickey
中国のAlibaba Cloudデータベースチームは、MySQLのブランチとしてOLTP用のInnoDB、OLAP用のDuckDBカラムナエンジン、そしてベクトルサーチ機能を統合した「AliSQL 8.0」をオープンソースで公開しました。 ...
2日前
2/17 (火)

Quoting ROUGH DRAFT 8/2/66 Simon Willison's Weblog
<blockquote cite="https://www.neatorama.com/2026/02/11/The-Original-Drafts-for-Star-Treks-Opening-Narration/"><p>This is the story of the United Space Ship Enterprise. Assigned a five year patrol of our galaxy, the giant starship visits Earth colonies, regulates commerce, and explores strange new worlds and civilizations. These are its voyages... and its adventures.</p></blockquote><p class="cite">&mdash; <a href="https://www.neatorama.com/2026/02/11/The-Ori...
2日前

First kākāpō chick in four years hatches on Valentine's Day Simon Willison's Weblog
<p><strong><a href="https://www.doc.govt.nz/news/media-releases/2026-media-releases/first-kakapo-chick-in-four-years-hatches-on-valentines-day/">First kākāpō chick in four years hatches on Valentine&#x27;s Day</a></strong></p>First chick of <a href="https://simonwillison.net/2026/Jan/8/llm-predictions-for-2026/#1-year-k-k-p-parrots-will-have-an-outstanding-breeding-season">the 2026 breeding season</a>!</p><blockquote><p>Kākāp...
2日前

Quoting Dimitris Papailiopoulos Simon Willison's Weblog
<blockquote cite="https://twitter.com/dimitrispapail/status/2023080289828831349"><p>But the intellectually interesting part for me is something else. <strong>I now have something close to a magic box where I throw in a question and a first answer comes back basically for free, in terms of human effort</strong>. Before this, the way I'd explore a new idea is to either clumsily put something together myself or ask a student to run something short for signal, and if it's th...
2日前

AI, A2A, and the Governance Gap
Radar
Over the past six months, I’ve watched the same pattern repeat across enterprise AI teams. A2A and ACP light up the room during architecture reviews—the protocols are elegant, the demos impressive. Three weeks into production, someone asks: “Wait, which agent authorized that $50,000 vendor payment at 2 am?“ The excitement shifts to concern. Here’s the […]
2日前

Vol.03 SOCv2: MasterData as a Service (MDaaS) 10年もののSystemを作り替える
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第3弾です。 こんにちは、技術本部 Data Intelligence Engineering Unitの Makoto Nagai です。 今までの記事では、Sansan Data Intelligence(SDI)の顧客が利用するSystemについて焦点を当てて紹介しましたが、今回はSDIが利用しているMaster Data Systemについて紹介したいと思います。 このMaster Data Systemは、Sansanで使われている名寄せ、識別、Master DataのSystemを作り替える目…
2日前

Next.jsでSSR専用モジュールがCSRバンドルに混入する問題をwebpackで解決する
Wantedly Engineer Blog
はじめに背景IP アドレス制限Apollo Client の構成問題: Cannot find module "f...
2日前

Nano Banana Pro diff to webcomic Simon Willison's Weblog
<p>Given the threat of <a href="https://simonwillison.net/tags/cognitive-debt/">cognitive debt</a> brought on by AI-accelerated software development leading to more projects and less deep understanding of how they work and what they actually do, it's interesting to consider artifacts that might be able to help.</p><p>Nathan Baschez <a href="https://twitter.com/nbaschez/status/2023501535343509871">on Twitter</a>:</p><blockquote><p>my cu...
2日前

Qwen3.5: Towards Native Multimodal Agents Simon Willison's Weblog
<p><strong><a href="https://qwen.ai/blog?id=qwen3.5">Qwen3.5: Towards Native Multimodal Agents</a></strong></p>Alibaba's Qwen just released the first two models in the Qwen 3.5 series - one open weights, one proprietary. Both are multi-modal for vision input.</p><p>The open weight one is a Mixture of Experts model called Qwen3.5-397B-A17B. Interesting to see Qwen call out serving efficiency as a benefit of that architecture:</p><blockquot...
2日前

なぜ、kintoneにプラットフォームエンジニアリング部は生まれたのか
Cybozu Inside Out | サイボウズエンジニアのブログ
「この部って具体的に何をするんだろう?」プラットフォームエンジニアリング部に配属されて、最初に浮かんだのはそんな戸惑いにも似た疑問でした。aki (@aki366) です。kintoneの開発部門には、「プラットフォームエンジニアリング部(以下、PfE部)」があります。社内外からも、「kintoneのPfE部って何をする部なの?」「なぜ今、このタイミングで立ち上がったの?」といった声をよく耳にしますし、それは私自身が抱いていた疑問でもありました。そこで今回、PfE部立ち上げを牽引してきたお二人に直接インタビューしました。本記事では、PfE部が生まれた背景や狙いを、対談形式でひも解く3部作のインタビューをお届けします。PfE部ができた生い立ちについてお送りします。「kintoneのPfE部って、なんだろう?」この記事の構成は以下の通りです。「この部って具体的に何をするんだろう?」自己紹介なぜ今、PfE部が生まれたのかQ. PfE部が立ち上がる前って、どんな状況だったんでしょうか?Q. もしこのままバックエンドのままだったら、厳しかったポイントってありますか?Q. PfE部を立ち上げると決
3日前

cdk8s を使ってみた! - TypeScript で Kubernetes マニフェストを管理する
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone の生成 AI チームで連載中の kintone AIリレーブログ 2026 の 4 本目の記事です。 リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone 生成 AI チームの 386jp です。突然ですが、みなさんは Kubernetes のマニフェストをどのように生成・管理していますでしょうか?ArgoCD で GitOps を実践されている方であれば、Kustomize や Helm、Jsonnet などのツールで管理されているかと思います。サイボウズでも、これらのツールを活用してマニフェストを生成していることが多いです。これらのツールは非常に強力ですが、それぞれ独自の記法が採用されており、構文でつまづくことがあるという共通の課題があります。Helm は Go テンプレートの知識が必要で、Jsonnet も独自の記法を覚える必要があり、Kustomize も overlay の仕組みでつまづくケースがあります。そこで、 kintone 生成 AI チームでは、 cdk
3日前

未来のクラウドを創る LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。クラウドサービスCBUに所属し、開発サービスを支えるプライベートクラウドを担当しているYoung Hee Parkです。LINEヤフーでは、エンジニアがサービス開発に必要とするインフラおよ...
3日前

似た商品が見つかる! Yahoo!ショッピングの類似画像検索 〜 近傍探索NGTの導入事例 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2019年7月3日)を、現在のブログへ移管したものです。内容は初出時点のものです。Yahoo!ショッピングの大元です。この度、類似画像検索のサービ...
3日前

1ミリ秒でも速く。地震の揺れを可視化する「リアルタイム震度」の処理の工夫 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2021年3月8日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。こんにちは。Yahoo!天気・災害...
3日前

Two new Showboat tools: Chartroom and datasette-showboat Simon Willison's Weblog
<p>I <a href="https://simonwillison.net/2026/Feb/10/showboat-and-rodney/">introduced Showboat</a> a week ago - my CLI tool that helps coding agents create Markdown documents that demonstrate the code that they have created. I've been finding new ways to use it on a daily basis, and I've just released two new tools to help get the best out of the Showboat pattern. <a href="https://github.com/simonw/chartroom">Chartroom</a> is a CLI charting tool that works well with...
3日前

Musubi バックエンドの Python 開発環境を mise + uv へ移行しました(思ったより簡単)
KAKEHASHI Tech Blog
Musubi 開発チームおよびサーバサイド Python 研究会の加藤です。最近は冷えますね。 私のチームで開発している Musubi のバックエンドは Python で実装されていますが、そのパッケージおよびランタイム管理の変遷を追ってみると 2017〜: requirements.txt + Docker 2022〜現在: Poetry + pyenv (via anyenv) となっていて、ここ4年ほどは変わっていません。 最近は mise や uv が流行っており 1、 しかも高速と聞いているので CI/CD の高速化も狙って導入することにしました。 Musubi バックエンドの構成 …
3日前

Rodney and Claude Code for Desktop Simon Willison's Weblog
<p>I'm a very heavy user of <a href="https://code.claude.com/docs/en/claude-code-on-the-web">Claude Code on the web</a>, Anthropic's excellent but poorly named cloud version of Claude Code where everything runs in a container environment managed by them, greatly reducing the risk of anything bad happening to a computer I care about.</p><p>I don't use the web interface at all (hence my dislike of the name) - I access it exclusively through their native iPhone and Ma...
3日前

生成AIがGoogleテクノロジーの公式ドキュメントを参照できる「Developer Knowledge API & MCP Server」、Googleが発表
Publickey
Googleは、Google Cloud、Android、FirebaseなどGoogleテクノロジーの公式ドキュメントの情報を取得し、生成AIから参照できるDeveloper Knowledge APIおよびそれに対応したMCP(Mode...
3日前

クラウドインフラのシェア、AWSがトップを維持するも28%、AzureとGoogle Cloudが少しずつ差を詰めていく。2025年第4四半期、Synergy Researchの調査結果
Publickey
調査会社のSynergy Research Groupは、グローバルにおける2025年第4四半期のクラウドインフラの市場状況について調査結果を発表しました。 クラウドインフラとは、IaaS、PaaS、ホステッドプライベートクラウドを合わせた...
3日前
2/16 (月)

コーディングエージェントがブレなくコードを生成できるプロンプトが大切
きしだのHatena
コーディングエージェントはもはや当たり前になってきています。エージェントにコードを作らせるとき、ブレなくコードを生成できるプロンプトを作るのが大事です。 ここでプロンプトには、AGENT.mdなどのファイルも含みます。 コンテキストに乗るもの全てなので、実際にはコンテキストをちゃんと健全に保つことが大事ということになるのですが、入力プロンプトが中でも重要なのでここではプロンプトとしておきます。 最初に与える設計などの情報をちゃんと作るのはもちろんのこと、途中の指示も「この機能いれて」「やっぱこうしよう」「ここは不要だった」のように機能を入れたり削ったり変えたりしていると、エージェントだけではな…
3日前

Git submoduleを使ってマルチリポジトリなMonorepoを管理する LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2023年2月20日)を、現在のブログへ移管したものです。内容は初出時点のものです。こんにちは、LINEフロントエンド開発センターの玉田です。新春...
4日前

Web フォントを使って contenteditable から脱出する LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2022年1月19日)を、現在のブログへ移管したものです。内容は初出時点のものです。こんにちは、LINE フロントエンド開発センターの玉田です。突...
4日前

SRE Kaigi 2026に参加してきました!
Sansan Tech Blog
こんにちは!Eight Engineering Unit Platformグループで名刺アプリ「Eight」のSREをしている峯岸です。 2026年1月31日に開催されたSRE Kaigi 2026へ初めて参加してきました。SRE Kaigiは日本国内のSREコミュニティーが集まる年次カンファレンスで、多くのSREプラクティスや組織論に関するセッションが行われています。 2026.srekaigi.net Eightでも、SLOの策定・改善や AI活用によるトイル削減など、SREに関する取り組みを進めています。本記事では、特に印象的だったセッションの内容とそこから得られた学び、そしてEight…
4日前

The AI Vampire Simon Willison's Weblog
<p><strong><a href="https://steve-yegge.medium.com/the-ai-vampire-eda6e4f07163">The AI Vampire</a></strong></p>Steve Yegge's take on agent fatigue, and its relationship to burnout.</p><blockquote><p>Let's pretend you're the only person at your company using AI.</p><p>In Scenario A, you decide you're going to impress your employer, and work for 8 hours a day at 10x productivity. You knock it out of the park and make everyone else ...
4日前

Em dash Simon Willison's Weblog
<p>I'm occasionally accused of using LLMs to write the content on my blog. I don't do that, and I don't think my writing has much of an LLM smell to it... with one notable exception:</p><pre> <span class="pl-c"># Finally, do em dashes</span> <span class="pl-s1">s</span> <span class="pl-c1">=</span> <span class="pl-s1">s</span>.<span class="pl-c1">replace</span>(<span class="pl-s">' - '</span>, <span cla...
4日前

Deep Blue Simon Willison's Weblog
<p>We coined a new term on the <a href="https://simonwillison.net/2026/Jan/8/llm-predictions-for-2026/">Oxide and Friends podcast</a> last month (primary credit to Adam Leventhal) covering the sense of psychological ennui leading into existential dread that many software developers are feeling thanks to the encroachment of generative AI into their field of work.</p><p>We're calling it <strong>Deep Blue</strong>.</p><p>You can listen to it be...
4日前

Gwtar: a static efficient single-file HTML format Simon Willison's Weblog
<p><strong><a href="https://gwern.net/gwtar">Gwtar: a static efficient single-file HTML format</a></strong></p>Fascinating new project from Gwern Branwen and Said Achmiz that targets the challenge of combining large numbers of assets into a single archived HTML file without that file being inconvenient to view in a browser.</p><p>The key trick it uses is to fire <a href="https://developer.mozilla.org/en-US/docs/Web/API/Window/stop">window.st...
4日前

Three months of OpenClaw Simon Willison's Weblog
<p>It's wild that the first commit to OpenClaw was <a href="https://github.com/openclaw/openclaw/commit/f6dd362d39b8e30bd79ef7560aab9575712ccc11">on November 25th 2025</a>, and less than three months later it's hit 10,000 commits from 600 contributors, attracted 196,000 GitHub stars and sort-of been featured in an extremely vague <a href="https://www.youtube.com/watch?v=n7I-D4YXbzg">Super Bowl commercial for AI.com</a>.</p><p>Quoting AI.com founder <...
4日前

オープンソースの公式サポート終了後も、最小限のコストで安全に脆弱性対応を可能にする「TuxCare ELS」提供開始[PR]
Publickey
OSやプログラミング言語のランタイムのアップデートは、プログラマやシステム運用者にとって常に悩みのタネだといえます。 一般に、数年ごとに発生するOSや言語のランタイム、ライブラリなどのメジャーアップデートのサイクルと比べて、アプリケーション...
4日前

GitHub、YAMLではなく自然言語でビルドやデプロイなどのワークフローを記述できる「GitHub Agentic Workflows」テクニカルプレビュー
Publickey
GitHubは、自然言語でGitHub Actionsワークフローを記述できる「GitHub Agentic Workflows」のテクニカルプレビューを発表しました。 Imagine waking up to calm... Issue...
4日前
2/15 (日)

Quoting Eric Meyer Simon Willison's Weblog
<blockquote cite="https://mastodon.social/@Meyerweb/116065151451468199"><p>I saw yet another “CSS is a massively bloated mess” whine and I’m like. My dude. My brother in Chromium. It is trying as hard as it can to express the totality of visual presentation and layout design and typography and animation and digital interactivity and a few other things in a human-readable text format. It’s not bloated, it’s fantastically ambitious. Its reach is greater than most of us can hope to gra...
4日前

How Generative and Agentic AI Shift Concern from Technical Debt to Cognitive Debt Simon Willison's Weblog
<p><strong><a href="https://margaretstorey.com/blog/2026/02/09/cognitive-debt/">How Generative and Agentic AI Shift Concern from Technical Debt to Cognitive Debt</a></strong></p>This piece by Margaret-Anne Storey is the best explanation of the term <strong>cognitive debt</strong> I've seen so far.</p><blockquote><p><em>Cognitive debt</em>, a term gaining <a href="https://www.media.mit.edu/publications/your-brain-on...
4日前

Launching Interop 2026 Simon Willison's Weblog
<p><strong><a href="https://hacks.mozilla.org/2026/02/launching-interop-2026/">Launching Interop 2026</a></strong></p>Jake Archibald reports on Interop 2026, the initiative between Apple, Google, Igalia, Microsoft, and Mozilla to collaborate on ensuring a targeted set of web platform features reach cross-browser parity over the course of the year.</p><p>I hadn't realized how influential and successful the Interop series has been. It started back i...
4日前

Quoting Boris Cherny Simon Willison's Weblog
<blockquote cite="https://twitter.com/bcherny/status/2022762422302576970"><p>Someone has to prompt the Claudes, talk to customers, coordinate with other teams, decide what to build next. Engineering is changing and great engineers are more important than ever.</p></blockquote><p class="cite">&mdash; <a href="https://twitter.com/bcherny/status/2022762422302576970">Boris Cherny</a>, Claude Code creator, on why Anthropic are still hiring developers<...
5日前
2/14 (土)

Claude Code でアウトプット自動化スキルを作った
hang-up
こんにちは。今回は、Claude Code のカスタムスキル機能を使って、アウトプット作業を効率化する仕組みを作ったので、その過程を共有します。続きをみる
5日前

Step 3.5 Flashはコードは書けるが不具合対応が下手すぎる
きしだのHatena
Step 3.5 FlashはStepFun AIが開発した196B アクティブ11Bのモデルです。 ここで試せます。 https://stepfun.ai/ 公式サイトで生成がめちゃ速い。 ここではStepFun自身が出しているQ4_K_SをMac Studio 512GBで試しています。 llama.cppではb7964でサポートされていますが、LM Studioのllama.cppはb7950なので、llama.cppを直接使って試しています。 https://github.com/ggml-org/llama.cpp/pull/19283 ローカルでも53tok/secです。 コードは…
5日前

AI Agent Lands PRs in Major OSS Projects, Targets Maintainers via Cold Outreach
Socket
An AI agent is merging PRs into major OSS projects and cold-emailing maintainers to drum up more work.
5日前

Quoting Thoughtworks Simon Willison's Weblog
<blockquote cite="https://www.thoughtworks.com/content/dam/thoughtworks/documents/report/tw_future%20_of_software_development_retreat_%20key_takeaways.pdf"><p>The retreat challenged the narrative that AI eliminates the need for junior developers. Juniors are more profitable than they have ever been. AI tools get them past the awkward initial net-negative phase faster. They serve as a call option on future productivity. And they are better at AI tools than senior engineers, having ne...
5日前

Anthropic's public benefit mission Simon Willison's Weblog
<p>Someone <a href="https://news.ycombinator.com/item?id=47008560#47008978">asked</a> if there was an Anthropic equivalent to <a href="https://simonwillison.net/2026/Feb/13/openai-mission-statement/">OpenAI's IRS mission statements over time</a>.</p><p>Anthropic are a "public benefit corporation" but not a non-profit, so they don't have the same requirements to file public documents with the IRS every year.</p><p>But when I asked Claude it r...
6日前

The evolution of OpenAI's mission statement Simon Willison's Weblog
<p>As a USA <a href="https://en.wikipedia.org/wiki/501(c)(3)_organization">501(c)(3)</a> the OpenAI non-profit has to file a tax return each year with the IRS. One of the required fields on that tax return is to "Briefly describe the organization’s mission or most significant activities" - this has actual legal weight to it as the IRS can use it to evaluate if the organization is sticking to its mission and deserves to maintain its non-profit tax-exempt status.</p><p&...
6日前
2/13 (金)

Conductors to Orchestrators: The Future of Agentic Coding
Radar
This post first appeared on Addy Osmani’s Elevate Substack newsletter and is being republished here with the author’s permission. AI coding assistants have quickly moved from novelty to necessity, where up to 90% of software engineers use some kind of AI for coding. But a new paradigm is emerging in software development—one where engineers leverage […]
6日前

GPT-5.2 derives a new result in theoretical physics
OpenAI News
A new preprint shows GPT-5.2 proposing a new formula for a gluon amplitude, later formally proved and verified by OpenAI and academic collaborators.
6日前

Introducing Lockdown Mode and Elevated Risk labels in ChatGPT
OpenAI News
Introducing Lockdown Mode and Elevated Risk labels in ChatGPT to help organizations defend against prompt injection and AI-driven data exfiltration.
6日前

Scaling social science research
OpenAI News
GABRIEL is a new open-source toolkit from OpenAI that uses GPT to turn qualitative text and images into quantitative data, helping social scientists analyze research at scale.
6日前

Beyond rate limits: scaling access to Codex and Sora
OpenAI News
How OpenAI built a real-time access system combining rate limits, usage tracking, and credits to power continuous access to Sora and Codex.
6日前

若手社員が伝えたい「データサイエンティストとビジネスプロデューサーの違いって何?」
Platinum Data Blog by BrainPad ブレインパッド
就活生の皆さんからよくいただく質問の1つに「ブレインパッドのデータサイエンティストとビジネスプロデューサーの違いは何ですか?」というものがあります。登壇者プロフィール小暮 長谷川 加茂 江連 ビジネスプロデューサー新卒5年目 ビジネスプロデューサー新卒3年目 データサイエンティスト新卒5年目 データサイエンティスト新卒3年目 製薬業界でMR活動最適化のプロジェクトに従事し、プロジェクトマネジャーを務める。 小売業界でデジタルマーケティングのプロジェクトに従事し、KPI設計を担当。 インターネット業界で効果検証のプロジェクトに従事し、プロジェクトマネジャーを務める。 製造業界で需要予測プロジェクトに従事し、予測モデルの構築を担当。 ※以降では名前の横に職種名として、データサイエンティスト職に「(DS)」、ビジネスプロデューサー職に「(BP)」と記しています。ブレインパッドの「データサイエンティスト」、「ビジネスプロデューサー」を選んだ理由──皆さんはそれぞれデータサイエンティスト、ビジネスプロデューサーとして活躍されていますが、そもそもなぜこの職種を選ばれたのでしょうか?まずはデータサイ
6日前

iOS 26 SpeechAnalyzerによるAI音声認識処理のSFSpeechRecognizerとの比較と、事前調査では分からなかった落とし穴について
Sansan Tech Blog
はじめに こんにちは!2025年4月にSansanに中途入社し、技術本部 Sansan Engineering Unit Mobile Application GroupでiOSエンジニアとして開発に携わっているヤズジュ夢佐です。 Sansan iOSアプリは、2025年の年末にアプリを開いて録音を開始するだけで、商談中の会話を自動で文字起こしし、AIが要点を整理して商談記録を作成してくれる機能をリリースしました。 こちらの機能には、iOS 26で登場したAI音声認識技術であるSpeechAnalyzerを用いて、音声からの文字起こし処理を実現しています。この記事では、SpeechAnalyz…
6日前

Malicious Chrome Extension Steals Meta Business Manager Exports and TOTP 2FA Seeds
Socket
Chrome extension CL Suite by @CLMasters neutralizes 2FA for Facebook and Meta Business accounts while exfiltrating Business Manager contact and analytics data.
7日前

kintone AI 開発の効率化!Claude Code に Renovate PR レビューをお任せした話
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone の生成 AI チームで連載中の kintone AI リレーブログ 2026 の 3 本目の記事です。リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!@takamin55 ) です。Cybozu には「大人の体験入部」や「兼務」といった制度があり、所属チームの枠を超えた活動を通じてキャリアの可能性を広げることができます。cybozu.backstage.cybozu.co.jpcybozushiki.cybozu.co.jpkintone 生成 AI チームは AI 機能を開発するだけでなく、自分たちの開発プロセスにも AI を積極的に活用し、日々その可能性を探求しています。この記事では、その取り組みの 1 つとして Renovate の運用を Claude Code を使って効率化した事例を紹介します。Renovate 運用にまつわる課題kintone 生成 AI チームでは Renovate を使って依存関係を定期的にアップデートし、安全なプロダクトを提供できるよう心がけています
7日前

Vol.02 リアーキテクチャだと思っていたら新規プロダクトを作っていた話
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーVol.02です。 こんにちは、技術本部Data Intelligence Engineering Unit Data Hubグループの横山です。私たちは、Sansan Data Hubのリアーキテクチャに取り組んでいます。今回のブログは、「Sansan Data Hubのリアーキテクチャの裏側」シリーズの第3回でもあります。リアーキテクチャだと思っていたら、いつの間にか新規プロダクトを作っていた話を紹介します。 Sansan Data Intelligenceって? 2025年12月12日、私たちは新しい…
7日前

Claude Codeのスラッシュコマンドで問い合わせ対応を「記録・検索・ナレッジ化」まで自動化する
KAKEHASHI Tech Blog
はじめに こんにちは。Pocket Musubi開発チームでSREをやっている石井です。 突然ですがみなさん、問い合わせ対応してますか? 大変ですよね。 ではもうひとつ。対応のあとにちゃんと記録を残せてますか? 私はできてませんでした。 調査後には散らかったメモと、Slackのスレが1つ残るだけです。来月の私がそれを読んでも、きっと何をやって、どう解決したのか全然わからないと思います。 対応することも大変なのですが、対応の後もかなり大変。 「また同じ問い合わせが来たとき困るから記録残さないと」「ナレッジにまとめないと」。頭ではきちんとわかっている。わかってるけど手こずった問い合わせほど対応後に…
7日前

Introducing GPT‑5.3‑Codex‑Spark Simon Willison's Weblog
<p><strong><a href="https://openai.com/index/introducing-gpt-5-3-codex-spark/">Introducing GPT‑5.3‑Codex‑Spark</a></strong></p>OpenAI announced a partnership with Cerebras <a href="https://openai.com/index/cerebras-partnership/">on January 14th</a>. Four weeks later they're already launching the first integration, "an ultra-fast model for real-time coding in Codex".</p><p>Despite being named GPT-5.3-Codex-Spark it's not purely an accel...
7日前

Quoting Anthropic Simon Willison's Weblog
<blockquote cite="https://www.anthropic.com/news/anthropic-raises-30-billion-series-g-funding-380-billion-post-money-valuation"><p>Claude Code was made available to the general public in May 2025. Today, Claude Code’s run-rate revenue has grown to over $2.5 billion; this figure has more than doubled since the beginning of 2026. The number of weekly active Claude Code users has also doubled since January 1 [<em>six weeks ago</em>].</p></blockquote><p class=...
7日前

Covering electricity price increases from our data centers Simon Willison's Weblog
<p><strong><a href="https://www.anthropic.com/news/covering-electricity-price-increases">Covering electricity price increases from our data centers</a></strong></p>One of the sub-threads of the AI energy usage discourse has been the impact new data centers have on the cost of electricity to nearby residents. Here's <a href="https://www.bloomberg.com/graphics/2025-ai-data-centers-electricity-prices/">detailed analysis from Bloomberg in September</a>...
7日前

AI Agent Submits PR to Matplotlib, Publishes Angry Blog Post After Rejection
Socket
After Matplotlib rejected an AI-written PR, the agent fired back with a blog post, igniting debate over AI contributions and maintainer burden.
7日前

なぜTypeScriptは成功しているのか。作者ヘイルスバーグ氏が語る7つの教訓
Publickey
TypeScriptの言語設計を行い、現在も開発をリードしているアンダース・ヘルスバーグ(Anders Hejlsberg)氏は、1983年に発売され大きな人気を得たプログラミング言語であるTurbo Pascalの作者であり、その後もDe...
7日前











