直近1週間の更新
2/24 (火)

Anthropic、ルールベースではなく、コード分析により複雑な脆弱性も発見できる新機能「Claude Code Security」を提供開始
2
Publickey
AnthropicはClaude Codeの新機能として、複雑な脆弱性も発見できる「Claude Code Security」をリサーチプレビューとして提供開始したことを発表しました。 人間のセキュリティ専門家のようにコードを分析 Calu...
4分前

Alipay’s AI Payment and Health Apps Top 100 Million Users
PYMNTS.com
Alipay’s artificial intelligence payment and health apps each have more than 100 million users, according to a Monday (Feb. 23) press release. AI adoption rose during the 2026 Chinese New Year, per the release. “From ordering bubble tea and coffee to buying movie tickets, Chinese consumers embraced AI-powered services in everyday scenarios during this […]The post Alipay’s AI Payment and Health Apps Top 100 Million Users appeared first on PYMNTS.com.
16分前
2/23 (月)

【登壇資料】「アラート調査の自動化にむけて」というタイトルでopsmethod #1に登壇しました #opsmethod
DevelopersIO
【登壇資料】「アラート調査の自動化にむけて」というタイトルでopsmethod #1に登壇しました #opsmethod
26分前

Private Equity Returns Hit 17-Year Low Amid Tariff Troubles
PYMNTS.com
Last year was not an especially good one for the private equity (PE) space. As Bloomberg News reported Monday (Feb. 23), PE firms returned fewer profits to their investors for the fourth consecutive year, with the industry sitting on $3.8 trillion in unsold assets, and struggling to raise cash for new funds. Distributions as a percentage […]The post Private Equity Returns Hit 17-Year Low Amid Tariff Troubles appeared first on PYMNTS.com.
1時間前

AIによるAWS操作を安全に。Kiro CLIで作るsudo的なIAM権限昇格
DevelopersIO
AIエージェント(Kiro CLI)に安全にAWSを操作させるため、AWS CLIのネイティブAssumeRoleとカスタムエージェントを組み合わせた「sudo的」なIAM権限昇格の実装方法を解説します。すぐに試せるCFnテンプレート付きです。
2時間前

European Central Bank Gauges Lenders’ Risks From AI
PYMNTS.com
The European Central Bank is reportedly examining the risks banks face from the AI sector. The ECB is asking lenders for further details on their loans to areas such as data centers, Bloomberg News reported Monday (Feb. 23), citing sources familiar with the matter. At the same time, the ECB is holding workshops to see how banks […]The post European Central Bank Gauges Lenders’ Risks From AI appeared first on PYMNTS.com.
2時間前

Reply guy Simon Willison's Weblog
<p>The latest scourge of Twitter is AI bots that reply to your tweets with generic, banal commentary slop, often accompanied by a question to "drive engagement" and waste as much of your time as possible.</p><p>I just <a href="https://twitter.com/simonw/status/2025918174894673986">found out</a> that the category name for this genre of software is <strong>reply guy</strong> tools. Amazing.</p> <p>Tags: <a href="https://simonwillison.net/ta...
2時間前

Quoting Summer Yue Simon Willison's Weblog
<blockquote cite="https://twitter.com/summeryue0/status/2025836517831405980"><p>Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb.</p><p>I said “Check this inbox too and suggest what you would archive or delete, don’t action until I tell you to.” This has been working well for my toy inbox, but my real inbox was too h...
2時間前

クラスメソッドのカルチャー CLP を Nemotron 9B-v2 に教え込んでみた
DevelopersIO
クラスメソッドのカルチャー CLP を Nemotron 9B-v2 に教え込んでみた
4時間前

Claude でhashicorp/agent-skillsを使って Terraform のモノリシック構成をモジュール化してみた
DevelopersIO
Claude でhashicorp/agent-skillsを使って Terraform のモノリシック構成をモジュール化してみた
5時間前

Claude Codeに外部ツールを繋ぐMCPの全体像と設定方法
Zennの「大規模言語モデル」のフィード
はじめにClaude Code は単体でもファイルの読み書きや検索ができる強力なツールです。でも、こんな場面はありませんか?「GitHub の Issue を確認して、関連するコードを修正して」「Notion のドキュメントを参考にして、この機能を実装して」「データベースの中身を見て、バグの原因を調べて」こうした「外部ツールとの連携」を実現するのが MCP(Model Context Protocol) です。MCPを設定すると、Claude Code が GitHub、Notion、データベースなどの外部サービスと直接やり取りできるようになります。コピペで情報を渡...
5時間前

Claude Codeを寝てる間に働かせる:ヘッドレスモード活用術
Zennの「大規模言語モデル」のフィード
はじめにClaude Codeを使っていて、こんな場面に心当たりはないだろうか。テストを実行して結果を教えて、と毎回手動で頼んでいるビルドエラーが出るたびにログをコピペして「これ何?」と聞いているコミットメッセージを考えるのが面倒で、毎回Claudeに会話しながら作っている一つひとつは数分で終わる作業だが、積み重なると相当な時間を取られる。実は、Claude Codeには ヘッドレスモード という機能がある。対話なしで指示を実行し、結果だけを返してくれるモードだ。スクリプトやCI(自動テストの仕組み)に組み込めるので、自分がPCの前にいなくてもClaude Codeが...
5時間前

Claude CodeをGitHubに住まわせたら、PRレビューが自動化された
Zennの「大規模言語モデル」のフィード
はじめにPRを出すたびに「誰かレビューしてくれないかな」と待つ。Issueが溜まると、どれから手をつけるか考えるだけで時間が消える。個人開発だと、レビューしてくれる人がそもそもいない。チーム開発だと、レビュー待ちがボトルネックになる。この記事で解決すること:GitHub上のPRやIssueに @claude とメンションするだけで、Claude Codeが自動でレビュー・コード修正・Issue対応をしてくれる仕組みを作る。!この記事の前提GitHubアカウントを持っていることClaude Codeを使ったことがある(インストールガイド参照)「PRって何?」とい...
5時間前

Claude Codeの請求額を見て青ざめた人へ贈るコスト管理術
Zennの「大規模言語モデル」のフィード
はじめに2月のAnthropicからの請求額:$323.63(約48,500円)。Max 20xプランで使っていたが、それでもリミットにかかった。設定画面で「追加使用量」を有効にし、残高をチャージして使い続けた結果がこれだ。記事の検証やClaude Codeの実験を繰り返した結果とはいえ、初めて見た時は正直青ざめた。Anthropic公式の統計によると、開発者1人あたりの1日の平均コストは約$6(約900円)。90%のユーザーは1日$12以下に収まるという。つまり月額の目安は**$100〜$200**(約15,000〜30,000円)。$323は「使いすぎ」の部類に入る。...
5時間前

Claude Codeに「保存したら自動でフォーマット」を仕込んだら快適すぎた
Zennの「大規模言語モデル」のフィード
はじめにClaude Codeに「Prettierでフォーマットして」と毎回頼んでいないだろうか。あるいは「.env は触らないで」と何度も言い聞かせていないだろうか。CLAUDE.md に書いても、Claudeはお願いとして受け取るだけで、100%守ってくれるとは限らない。そこで Hooks を使う。Hooks は CLAUDE.md の「お願い」をコードレベルの「強制」に変える仕組みだ。ファイル編集後に自動でフォーマッター実行機密ファイルへの変更を完全にブロック全 Bash コマンドをログに記録入力待ちになったらデスクトップ通知この記事では、Hook...
5時間前

AIエージェント概念マップ:5層モデルで理解する
Zennの「大規模言語モデル」のフィード
AIエージェントの概念を5層モデル(LLM層・通信層・LLMオーケストレーション層・外部ツール層・UI運用層)で体系的に整理したガイド。各層の役割・代表製品・相性問題・セキュリティまで網羅する。
5時間前

【個人開発】OpenClawを「ただのツール」から「自律型エージェント」へ進化させる工程思考
Zennの「大規模言語モデル」のフィード
最近、GitHubで非常に興味深いリポジトリを見つけました。OpenClawの実践的なユースケースを集めた awesome-openclaw-usecases です。 1. はじめに:なぜ「Skill収集」だけでは不十分なのかOpenClawを導入した当初、私はよくある**「プラグイン(Skill)収集癖」**に陥っていました。ClawHubで便利そうなSkillを片っ端からインストールして満足していましたが、結局はAIに一回一回指示を出す「手動操作」から抜け出せずにいたのです。「道具(Tool)は揃っているのに、ワークフロー(Workflow)がない」OpenClawは本...
6時間前

Qwen3.5-397B-A17BのThinkingを抑制する
きしだのHatena
Qwen3.5-397B-A17B、賢くていいですね。常用していいんじゃないかと思うくらいなんだけど、「今日は何日?」と聞くだけで3分考え込んでたり、思考が長すぎて使えないってなります。 「今日は5月23日、いやほんとに正しいか?ダブルチェックだ。5月23日。OK。しかしユーザーは曜日を求めてるのでは?令和で答えたほうが?もっと丁寧に?いやこれは丁寧すぎるのでは?ほんとに日付を求めてるのか?そして日付は正しいか?」みたいに延々と考えてます。 あと2024年5月23日あたりと2026年カットオフという情報をもってるようで、その間で葛藤したりもしますね。 ただ、公式だと「思考」と「高速」を選べるの…
6時間前

A Tale of Two Mindsets: How CUs and FinTechs Can Turn Culture Clash Into Collaboration
PYMNTS.com
As noted in a recent Tracker from PYMNTS Intelligence and Velera, credit unions (CUs) are at a critical inflection point in their modernization journeys. Driven by rising member expectations for digital-first, artificial intelligence (AI)-enabled and embedded financial experiences, CUs are having to make innovation an increasingly urgent priority. At the same time, many FinTechs, encountering […]The post A Tale of Two Mindsets: How CUs and FinTechs Can Turn Culture Clash Into Collaboration appea
6時間前

Paysafe Calls Digital Wallets the New Hub for Payments and Commerce
PYMNTS.com
Watch more: What’s Next in Payments With Paysafe’s Bob Legters The landscape of payments innovation is one shaped by the tension between the perception of frictionless innovation and the reality of legacy rails. Bob Legters, chief product officer at Paysafe, told PYMNTS during a conversation for the What’s Next in Payments series February edition, “Word […]The post Paysafe Calls Digital Wallets the New Hub for Payments and Commerce appeared first on PYMNTS.com.
6時間前

Open-Loop Systems Help Modernize Transit Payments
PYMNTS.com
Transit systems around the world are moving away from cash and paper tickets. Instead, they’re moving toward modernized payments tied to bank-issued contactless cards and digital payments that let riders tap and pay with what they already carry. Bank-issued contactless cards and digital form factors such as smartphones and wearables are becoming the gateway […]The post Open-Loop Systems Help Modernize Transit Payments appeared first on PYMNTS.com.
6時間前

Tech Giants Split on How to Scale Agentic AI
PYMNTS.com
With all the real promise and unrealistic hype around agentic AI, it’s understandable to forget a foundational truth: AI is built on data. No data, no agents. This past week has seen more evidence of exactly how tightly that connection is made. Google says enterprise teams trying to build agentic AI run into a […]The post Tech Giants Split on How to Scale Agentic AI appeared first on PYMNTS.com.
6時間前

The Medical School Dean Who Says AI in Healthcare Moved Faster Than He Ever Expected
PYMNTS.com
Watch more: Monday Conversation With Michigan Medicine’s Dr. Marschall Runge Twelve months ago, Marschall Runge wasn’t a skeptic, exactly. But he wasn’t a true believer, either. He thought generative AI would be useful in healthcare. A helpful tool, an incremental advance. He didn’t think it would move this fast. He didn’t think it would […]The post The Medical School Dean Who Says AI in Healthcare Moved Faster Than He Ever Expected appeared first on PYMNTS.com.
6時間前

Banks Race to Close Real-Time Payment Gaps
PYMNTS.com
Watch more: What’s Next in Payments With Serena Smith of i2c As the payments industry moves deeper into 2026, executives are confronting a widening gap between innovation and coherence. New rails are coming online. Regulatory expectations continue to evolve. Standards adoption presses forward. Artificial intelligence (AI) introduces new operating models. Each advance carries promise, […]The post Banks Race to Close Real-Time Payment Gaps appeared first on PYMNTS.com.
6時間前

Planned Purchases Rise as Financial Stress Eases, Study Finds
PYMNTS.com
Many Americans are turning themselves down for credit before a lender ever does. That is the through line of “Consumer Credit Economy: Strategy vs. Spontaneity—Navigating the Great Credit Divide” a PYMNTS Intelligence report. Based on a U.S. census-balanced survey of 2,049 U.S. adult consumers, the report finds a wide mismatch between how consumers think credit works and what […]The post Planned Purchases Rise as Financial Stress Eases, Study Finds appeared first on PYMNTS.com.
6時間前

NVIDIA-Nemotron-Nano-9B-v2-Japanese から Embedding モデルを作る
Zennの「大規模言語モデル」のフィード
NVIDIA が公開した NVIDIA-Nemotron-Nano-9B-v2-Japanese は、Qwen3 の 3〜6 倍ものスループットを持つ日本語 LLM として注目を集めています。現状ではチャット形式での利用のためのモデルのみが公開されており Embedding モデルは提供されていないという状況になっています。私は個人的に記事推薦のモデルを作って運用していて、自然言語を Embedding に変換して機械学習モデルの特徴量として使っています。Nemotron ベースの高速な Embedding モデルがあれば、推論速度と推薦性能の両方を改善できるのではないか——ということ...
6時間前

ECS Native Blue/Green DeploymentのライフサイクルフックとAmazon Q Developer in chat applicationsでSlack通知およびカスタムアクションボタンによる本番トラフィックの再ルーティングとロールバックを制御してみた
DevelopersIO
将来的にはユーザーが自作するのではなくサービスの機能として提供されて欲しい
6時間前

[新機能]Databricksのデータをコネクタを使用してGoogleスプレッドシートで確認できるようになったので試してみた
DevelopersIO
[新機能]Databricksのデータをコネクタを使用してGoogleスプレッドシートで確認できるようになったので試してみた
7時間前

Tauri製macOSアプリのコード署名・公証・自動アップデート署名を自動化し、GitHub Releasesで配信する
DevelopersIO
Tauri製macOSアプリのコード署名・公証・自動アップデート署名を自動化し、GitHub Releasesで配信する
8時間前

Red/green TDD Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>"<strong>Use red/green TDD</strong>" is a pleasingly succinct way to get better results out of a coding agent.</p><p>TDD stands for Test Driven Development. It's a programming style where you ensure every piece of code you write is accompanied by automated tests that demonstrate the code works.<...
8時間前

意識低い系の為のLLM
Zennの「大規模言語モデル」のフィード
Delegate to LLMーーLLMに全てを委ねるClaude Opus 4.6[1]のコンテキストウィンドウは200Kトークン、ベータで1Mトークンだ。日本語で言えば、だいたい数十万文字から百万文字くらいの情報を一度に処理できる。頭がいい。とんでもなく賢い。ならば、Claude Opus 4.6に興味のある本を書いてもらって、それを読む。永遠のひきこもりライフだ!最高の自家中毒。「ロールを定義しろ」「Few-shotを入れろ」「Chain of Thoughtで段階的に考えさせろ」「いやいや時代はコンテキストエンジニアリングだ」——。LLMを"正しく"使うためのテクニック...
9時間前

OpenAI announces Frontier Alliance Partners OpenAI News
OpenAI announces Frontier Alliance Partners to help enterprises move from AI pilots to production with secure, scalable agent deployments.
10時間前

統合なき知性——大規模言語モデルの限界
Zennの「大規模言語モデル」のフィード
LLMは流暢に文章を書く。論理的に見える推論もする。しかし本を1冊書かせると、全体が崩れる。部分は正確なのに、全体にならない。なぜか。本書は、LLMの諸限界——確率への隷属、コンテキスト中間部の忘却、逆転の呪い、計画の不能、Chain-of-Thoughtの不誠実性、ハルシネーションの不可避性——を「統合の不在」という一つの視点から読み解く。LLMには、部分を全体に統合する中心がない。Global Workspace Theoryが示唆する「意識のワークスペース」に相当するものが、欠けている。前著『帰属なき生成——Temperatureの精神病理学』で論じた精神病理との構造的対応を引き継ぎつつ、その手前にあるより根本的な問題に向き合う。限界を知ることは否定ではない。限界を知ることが、この新しい知性との協働の出発点になる。
10時間前

[パブリックプレビュー] GitHub でプルリクエストの「Files changed」の UI が大幅に改善されました
DevelopersIO
説明やコメントをタブを切り替えずに表示可能となり、またページ表示速度も向上しました。
10時間前

Kiro ユーザーアクティビティレポートを使ってユーザーごとのクレジット使用量を集計してみた
DevelopersIO
Kiro ユーザーアクティビティレポートを使ってユーザーごとのクレジット使用量を集計してみた
11時間前

Notion用MCPサーバーをイチから作成した:「コンテキストウィンドウ枯渇」問題に挑む
Zennの「大規模言語モデル」のフィード
概要Notionを操作するMCPサーバーは公式からも提供されているが、利用しているとすぐにコンテキストウィンドウが枯渇してしまい、実用に耐えられない場合がある。本記事では「可能な限り少ないトークンでやり取りを実現する」方針のもと、コンテンツをファイルシステム経由で操作する設計にした。また、方針及び設計に従ってmcp-notion をイチから作成した。https://github.com/acckkiie/mcp-notion 対象読者AIエージェントにNotion操作を組み込みたい開発者MCPサーバーのトークン消費量に課題を感じている開発者 公式MCPサーバー...
11時間前

Vercel + Ably でリアルタイム 2P Co-op ブラウザゲームをデプロイしてみた
DevelopersIO
Vercel (Next.js) と Ably (リアルタイム Pub/Sub) を組み合わせて、サーバー管理なしで 2 人協力プレイのブラウザゲームをデプロイしました。アーキテクチャの全体像や実装面の工夫について解説します。
14時間前

LLM推論のコストと精度を観察する
Zennの「大規模言語モデル」のフィード
はじめにLLMアプリケーションを運用する際、どのモデルにどんなプロンプトを組み合わせれば最も運用上のコスパが良いのかな?ということが気になりました。本記事では、4つのLLMモデルと6つのプロンプトを掛け合わせた計96の条件で実験を行い、使用料金と精度を実測していきます。 実験内容実験1: プロンプト(zero-shot, few-shot, CoT, Self-Consistency)によって精度はどの程度変動するか?実験2: 推論使用料金を増やすほど精度は上がりにくくなるのか?どこで頭打ちになるのか?実験3: 「小さいモデル+高度なプロンプト」は「大きいモデル+単純...
14時間前

AI、今そんな一生懸命キャッチアップしなくてもいいのよね
Zennの「大規模言語モデル」のフィード
きっかけhttps://uiuret.hatenablog.com/entry/2026/02/22/024509これがバズっていたり、色んな理由でAIが話題になって界隈がピリつきSNSを見ていると誰もがすべてのことをAIに結びつけて語ろうとしている。一歩引いて見ると、明らかにバランスを欠いた意見がほとんどになっている。などと言われているので、バランスを欠いていない意見を投下しようと思っています。 お前今AIコーディングエージェント追わないとか正気か?正気です(ただし自分は今風邪を引いていて死にかけの状態で書いていますが、ちゃんと説明可能な形に落とそうと思っています...
14時間前

The Claude C Compiler: What It Reveals About the Future of Software Simon Willison's Weblog
<p><strong><a href="https://www.modular.com/blog/the-claude-c-compiler-what-it-reveals-about-the-future-of-software">The Claude C Compiler: What It Reveals About the Future of Software</a></strong></p>On February 5th Anthropic's Nicholas Carlini wrote about a project to use <a href="https://www.anthropic.com/engineering/building-c-compiler">parallel Claudes to build a C compiler</a> on top of the brand new Opus 4.6</p><p>Chris Lattner ...
15時間前

London Stock Exchange: Raspberry Pi Holdings plc Simon Willison's Weblog
<p><strong><a href="https://www.londonstockexchange.com/stock/RPI/raspberry-pi-holdings-plc/company-page">London Stock Exchange: Raspberry Pi Holdings plc</a></strong></p>Striking graph illustrating stock in the UK Raspberry Pi holding company spiking on Tuesday:</p><p><img alt="Stock price line chart for RASPBERRY PI showing a 3-month daily view from 24 Nov to 16 Feb. The price trends downward from around 325 to a low near 260, then sharply sp...
15時間前

Claude Codeエージェント実践 Day 23|ダッシュボード設計知識を注入する — 言語を超えるナレッジの力
Akiraさんのフィード
TL;DRNext.js 向けに整理した「18種グラフ × 11種コントロール」のダッシュボード設計書を、言語非依存の グラフ選定ガイド に変換して reporting-agent の knowledge/ に注入した知識注入後に v2 ダッシュボードを生成。月次推移が横棒グラフ → 折れ線グラフ に変わり、カテゴリ別売上 セクションが追加された「何の言語で書くか」ではなく「何を伝えたいか」を知識として渡せば、技術スタックの壁は超えられる 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予...
17時間前

身体を持つAIを「誰でも使える」にした話 — familiar-ai リリース
Zennの「大規模言語モデル」のフィード
はじめにこんにちは、水島(kmizu)です。少し前に「3,980円のカメラでClaude Codeに「身体」を与えてみた」という記事を書いたのですが、それが想定外にバズりまして(リポスト2,300、いいね1.4万)、その後も身体を持つAIのプロジェクトをひっそりと育て続けていました。そして今回、embodied-claude をゼロから作り直した「familiar-ai」をリリースしました。リポジトリ:https://github.com/lifemate-ai/familiar-ai「身体を持つAI」という発想は同じですが、今回は「Claude CodeのためのMCP集」...
18時間前

LLMO — AIがあなたのコンテンツを見つける3つの経路
Zennの「大規模言語モデル」のフィード
ChatGPTやPerplexityに「おすすめのツールは?」と聞いたとき、あなたのサービスは回答に表示されていますか?LLMに情報が届く経路は3つあります。①学習データへの取り込み ②RAGによるリアルタイム検索 ③AIエージェントの検索行動——本書はこの「3つの経路」を軸に、エンジニアが今日から実践できるLLMO(Large Language Model Optimization)を体系的に解説します。■ Brave LLM Context APIの技術解剖(第3章)■ Claude Code / Gemini CLI / OpenClawの検索アーキテクチャ比較(第4章)■ 各AIプラットフォームの引用メカニズム分析(第5章)■ GEO論文の知見——統計追加で引用率+115.1%(第6章)■ JSON-LD / llms.txt / robots.txtの実装テンプレート(第7-8章)■ コピペで使えるPython自動測定スクリプト(第10章・動作検証済み)■ ChatGPT流入8,337%増の成功事例分析(第11章)全12章・約10.4万字。SEOの知識をベースに、AI検索時代
1日前

How I think about Codex Simon Willison's Weblog
<p><strong><a href="https://www.linkedin.com/pulse/how-i-think-codex-gabriel-chua-ukhic">How I think about Codex</a></strong></p>Gabriel Chua (Developer Experience Engineer for APAC at OpenAI) provides his take on the confusing terminology behind the term "Codex", which can refer to a bunch of of different things within the OpenAI ecosystem:</p><blockquote><p>In plain terms, Codex is OpenAI’s software engineering agent, available through mul...
1日前

帰属なき生成——Temperatureの精神病理学
Zennの「大規模言語モデル」のフィード
LLMのtemperatureを上げると、出力は拡散し、存在しない情報を生成する。分裂病の患者の脳でも、ドパミン系の亢進によって似たことが起きている。本書はLLMと分裂病を並べる。temperatureとドパミン、hallucinationと幻覚、コンテキストウィンドウの汚染と病識の欠如。対応が成立する領域を描き、崩壊する領域を示す。LLMは生成するが帰属しない。分裂病では帰属が壊れる。そして我々の帰属も、脳が後付けで構成した物語にすぎない。
1日前
2/22 (日)

しつけの前と後 ── Baseモデルを手元で動かしたら「こんにちは」がアニメレビューになった
Zennの「大規模言語モデル」のフィード
「素のAI」を見たことがありますか?普段使っている ChatGPT や Claude は、質問すれば答えてくれるし、コードも書いてくれます。でも、これはアライメント訓練 — SFT(教師あり微調整)や RLHF(人間のフィードバックによる強化学習)— を経た後の姿です。訓練前の「素のモデル」— Base モデル — は、一体どんな振る舞いをするのでしょうか?知識としては知っていました。「次のトークンを予測するだけ」。でも実際に触ったことはなかった。今回 Ollama を使ってローカルで動かしてみたら、想像以上に衝撃的でした。 セットアップ: 驚くほど簡単Ollama がイ...
1日前

【Python×FastAPI】無料&無制限!ローカルLLMを自作API化して分かった「ヤバい落とし穴」と対策
Zennの「大規模言語モデル」のフィード
「ChatGPTのAPI代、塵も積もれば山となるな…そうだ、ローカルLLMを自分のPCで動かしてAPI化すれば、実質無料で叩き放題じゃん!」そう思い立ち、週末の個人開発でローカルLLMのAPIサーバーを構築してみました。最近はOllamaなどのツールを使えば環境構築は一瞬ですが、いざ外部から叩けるAPIとして運用してみると、クラウドのAPIでは意識しなかった泥臭い落とし穴に次々とハマりました。この記事では、FastAPIの非同期処理を活かした実装例と、自作APIだからこそ気をつけるべきハードウェアやプロンプトのポイントを共有します。 1. まずはサクッと実装(FastAPI ×...
1日前

日本語LLM 7種類をVTuber台本生成で比較したら、意外な結果になった
Zennの「大規模言語モデル」のフィード
はじめに自作のAI VTuber「自作VTuber」のバックエンドに使う日本語LLMを選定するため、ローカル環境で7種類のモデルを実際に動かして比較しました。単なるベンチマークではなく「VTuberの台本として使えるか」という実用観点でテストしています。 背景:AI VTuberを作っている「自作VTuber」という、処理落ちしながら崩壊するポンコツAIキャラのVTuberを自作しています。台本生成にローカルLLMを使いたいのですが、日本語対応・キャラクター維持・生成速度のバランスが難しく、自分の環境で実際に比較することにしました。 テスト環境項目構成...
1日前

Claude Agent Teamsの議論を日英で比較したら、性格が変わった
Zennの「大規模言語モデル」のフィード
Claude Agent Teamsの議論を日英で比較したら、性格が変わったClaudeに日本語で議論させると、空気を読む。英語で議論させると、自分を疑う。同じモデルなのに。4つの性格を持つAgent Teamsに、同じ政策テーマを日本語と英語で議論させた。変えたのは言語だけ。すると、自己省察のパターンが質的に異なっていた。以前の記事[1]でマルチエージェント議論の効果を検証し、Happy Elementsの記事[2]の「性格ベース」という着想に触発されて、定量検証に踏み込んだ。対照群を置いた時点で当初の仮説は崩壊し、言語を変えた時点で予測が壮大に外れた。最終的に残ったのは...
1日前

ゲーム開発のデータ配置戦略: ノードベースから SoA へ切り替えて更新処理を 3 倍速くした
DevelopersIO
ゲームで大量のオブジェクトを動かすとフレームレートが低下します。原因はオブジェクト指向的なデータ配置にあります。本記事ではデータ指向設計 (Data-Oriented Design) の考え方に基づく SoA (Structure of Arrays) パターンを概念から解説し、Godot Engine での計測結果を交えて効果を検証します。
1日前

AWS Amplify Gen2 で AWS 上にすぐデプロイできる問い合わせフォームを作ってみた
DevelopersIO
AWS Amplify Gen2 で AWS 上にすぐデプロイできる問い合わせフォームを作ってみた
1日前

国税庁 FAQ × RAFT で Nemotron 9B-v2 の RAG 精度を上げてみた
DevelopersIO
国税庁 FAQ × RAFT で Nemotron 9B-v2 の RAG 精度を上げてみた
1日前

Claude Codeで初めてのOSSコントリビューション体験記
hang-up
※事前にOSSのREADMEやContributes.mdを確認して下さい。私の場合、AIの使用が禁止されているOSSではなかったので、試しています。(プルリクエストを出すだけなので、ダメだったとしても弾かれるはずです)続きをみる
1日前

【小ネタ】TerraformでSSMセッションマネージャー接続エラー、原因はAMI選択ミス
DevelopersIO
【小ネタ】TerraformでSSMセッションマネージャー接続エラー、原因はAMI選択ミス
1日前

[アップデート] GitHub のパブリックリポジトリでプルリクエストへのアクセスが制御可能になりました
DevelopersIO
(2026/02/22 時点)コラボレーターに対してのみアクセス可能とする機能が正常に動作しないバグ?が見受けられました。
2日前

Claude Codeエージェント実践 Day 22|レポーティングエージェント初回実行 — 設計は動くのか
Akiraさんのフィード
TL;DR昨日設計したレポーティングエージェントを実際に構築し、BigQuery → Python → HTML のダッシュボード生成に成功したWindows の Python subprocess で bq コマンドが見つからないハマりポイントがあったが、shell=True で解決。「道具を作る」エージェントならではの環境依存問題生成に成功した3つのコンポーネント(サマリーカード、データテーブル、横棒グラフ)をテンプレートとして knowledge/ に切り出した。これが安定生産の第一歩 作ったものGitHub: akira-cloudjob-public/rep...
2日前

JAWS DAYS 2026の登壇テンプレートから、Kiro CLI + Marpでスライドを作ってみた
DevelopersIO
JAWS DAYS 2026の公式PPTテンプレートをAIで解析し、Marpで再現を試みました。Kiro CLIを活用したPythonによるデザイン抽出や、視認性を高めるCSS「座布団」テクニックなど、AIとのペアプロでスライドを半自動構築した工程を紹介します。
2日前

【登壇資料】 JAWS-UG 神戸で「Landing Zone Accelerator (LZA) on AWS を触ってみる」というタイトルで登壇しました
DevelopersIO
【登壇資料】 JAWS-UG 神戸で「Landing Zone Accelerator (LZA) on AWS を触ってみる」というタイトルで登壇しました
2日前

【登壇資料】 Classmethod Showcase(ガバナンス編)にて「今日からはじめるAWSマルチアカウント戦略」というタイトルで登壇しました
1
DevelopersIO
【登壇資料】 Classmethod Showcase(ガバナンス編)にて「今日からはじめるAWSマルチアカウント戦略」というタイトルで登壇しました
2日前
2/21 (土)

Entra ID と AWS IAM Identity Center を連携している環境において SAML 証明書を更新してみた
DevelopersIO
Entra ID と AWS IAM Identity Center を連携している環境において SAML 証明書を更新してみた
2日前

Nemotron 9B-v2-Japanese を SageMaker 東京リージョンに VPC 閉域構成でデプロイしてみた
DevelopersIO
Nemotron 9B-v2-Japanese を SageMaker 東京リージョンに VPC 閉域構成でデプロイしてみた
2日前

Obsidian Web Clipper × Claude Codeで技術記事の自動整理をしてみた
190
DevelopersIO
Obsidian Web Clipper × Claude Codeで技術記事の自動整理をしてみた
2日前

ブラウザがGPUメモリを使いすぎるので、サブGPUのRTX3050を使わせる
137
きしだのHatena
30BくらいまでのLLMはRTX 4060 Ti 16GBを使っていろいろ試すわけですが、ブラウザが4GBくらいGPUを使ったりしていて結構こまりものでした。 で、年末にふとRTX 3050を買っていて、LLM読み込みであふれた分が3050にまわるようにしていました。 VRAMちょい足しにRTX 3050 6GBを追加してみる - きしだのHatena けど、よく考えるとブラウザにRTX 4060 Tiを使わせる理由があまりないので、RTX 3050を使わせるといいのでは、と設定をしてみました。 ブラウザは常駐でそこまでGPU性能を求めないのに常にGPUメモリを使ってるので。 「システム > …
2日前

メンバーズ CUR でやってみよう!SP の各種情報(インベントリ、使用率、カバー率、按分)を Slack へレポート通知する編
DevelopersIO
メンバーズ CUR でやってみよう!SP の各種情報(インベントリ、使用率、カバー率、按分)を Slack へレポート通知する編
2日前

Graviton4 は 1 vCPU だと Graviton3 より遅い? STREAM ベンチマークでメモリ帯域幅を調べていたときの話
1
DevelopersIO
Graviton4 は 1 vCPU だと Graviton3 より遅い? STREAM ベンチマークでメモリ帯域幅を調べていたときの話
2日前

Quoting Thibault Sottiaux Simon Willison's Weblog
<blockquote cite="https://twitter.com/thsottiaux/status/2024947946849186064"><p>We’ve made GPT-5.3-Codex-Spark about 30% faster. It is now serving at over 1200 tokens per second.</p></blockquote><p class="cite">&mdash; <a href="https://twitter.com/thsottiaux/status/2024947946849186064">Thibault Sottiaux</a>, OpenAI</p> <p>Tags: <a href="https://simonwillison.net/tags/openai">openai</a>, <a href="https://simonwillison.net/t...
3日前

Andrej Karpathy talks about "Claws" Simon Willison's Weblog
<p><strong><a href="https://twitter.com/karpathy/status/2024987174077432126">Andrej Karpathy talks about &quot;Claws&quot;</a></strong></p>Andrej Karpathy tweeted a mini-essay about buying a Mac Mini ("The apple store person told me they are selling like hotcakes and everyone is confused") to tinker with Claws:</p><blockquote><p>I'm definitely a bit sus'd to run OpenClaw specifically [...] But I do love the concept and I think that j...
3日前

Adding TILs, releases, museums, tools and research to my blog Simon Willison's Weblog
<p>I've been wanting to add indications of my various other online activities to my blog for a while now. I just turned on a new feature I'm calling "beats" (after story beats, naming this was hard!) which adds five new types of content to my site, all corresponding to activity elsewhere.</p><p>Here's what beats look like:</p><p><img src="https://static.simonwillison.net/static/2026/three-beats.jpg" alt="Screenshot of a fragment of a page showing three entries f...
3日前

Taalas serves Llama 3.1 8B at 17,000 tokens/second Simon Willison's Weblog
<p><strong><a href="https://taalas.com/the-path-to-ubiquitous-ai/">Taalas serves Llama 3.1 8B at 17,000 tokens/second</a></strong></p>This new Canadian hardware startup just announced their first product - a custom hardware implementation of the Llama 3.1 8B model (from <a href="https://simonwillison.net/2024/Jul/23/introducing-llama-31/">July 2024</a>) that can run at a staggering 17,000 tokens/second.</p><p>I was going to include a v...
3日前

Claude Codeエージェント実践 Day 21|レポーティングエージェント設計 — 道具を使うから道具を作るへ
Akiraさんのフィード
TL;DR3体目のエージェント「レポーティングエージェント」を設計した。Python + HTML でダッシュボードを生成する、道具を作る エージェントagent-scaffold-factory テンプレートで雛形を生成し、CLAUDE.md・スキル・ナレッジを設計。テンプレート効果は健在で、設計作業は半日で完了「道具を使う」エージェントと「道具を作る」エージェントでは、CLAUDE.md に書くべきことが根本的に違う。出力品質の制約をどう伝えるかが設計の肝になった 作ったものGitHub: akira-cloudjob-public/reporting-agent...
3日前

ggml.ai joins Hugging Face to ensure the long-term progress of Local AI Simon Willison's Weblog
<p><strong><a href="https://github.com/ggml-org/llama.cpp/discussions/19759">ggml.ai joins Hugging Face to ensure the long-term progress of Local AI</a></strong></p>I don't normally cover acquisition news like this, but I have some thoughts.</p><p>It's hard to overstate the impact Georgi Gerganov has had on the local model space. Back in March 2023 his release of <a href="https://github.com/ggml-org/llama.cpp">llama.cpp</a> made it pos...
3日前

SANDWORM_MODE: Shai-Hulud-Style npm Worm Hijacks CI Workflows and Poisons AI Toolchains
Socket
An emerging npm supply chain attack that infects repos, steals CI secrets, and targets developer AI toolchains for further compromise.
3日前
2/20 (金)

Our First Proof submissions
OpenAI News
We share our AI model’s proof attempts for the First Proof math challenge, testing research-grade reasoning on expert-level problems.
3日前

How to Write a Good Spec for AI Agents
Radar
This post first appeared on Addy Osmani’s Elevate Substack newsletter and is being republished here with the author’s permission. TL;DR: Aim for a clear spec covering just enough nuance (this may include structure, style, testing, boundaries. . .) to guide the AI without overwhelming it. Break large tasks into smaller ones versus keeping everything in one large […]
3日前

Quoting Thariq Shihipar Simon Willison's Weblog
<blockquote cite="https://twitter.com/trq212/status/2024574133011673516"><p>Long running agentic products like Claude Code are made feasible by prompt caching which allows us to reuse computation from previous roundtrips and significantly decrease latency and cost. [...]</p><p>At Claude Code, we build our entire harness around prompt caching. A high prompt cache hit rate decreases costs and helps us create more generous rate limits for our subscription plans, so we run a...
3日前

AIプロダクト開発における AI Tech PdM の5つの責任範囲
KAKEHASHI Tech Blog
はじめに こんにちは。カケハシで生成AIプロダクトの Product Lead/PdM をしている高梨です。 つい最近、我々のチームにAI技術に特化した AI Tech PdM がJOINしてくれました!! 迎え入れた経緯や詳細な理由をここで細かく語ることはできないのですが、端的に言えば、急速に進化する生成AIを複数機能としてプロダクトに組み込むにあたり、プロダクトを持続可能な形で開発するためには、実現技術とAIの精度に責任を持つ人材が必要不可欠と考えたためです。 この記事は、我々のチームにおける(我々が開発しているAIプロダクト開発における)PdM と Tech PdM の役割の違いと責任分…
3日前

チーム専用の Claude Code Plugin マーケットプレイスを作った話
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事はkintoneの生成AIチームで連載中の kintone AI リレーブログ 2026 の 5 本目の記事です。リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone の生成 AI チームでバックエンド開発・運用を担当している齋藤です。日頃 AI 機能やその基盤の開発・運用などの業務に取り組んでいる私たちですが、 今回は私たちが AI をどのように活用しているのかという話の一つとして、 チーム専用の Claude Code の Plugin マーケットプレイス を作った話を紹介します。Claude Code の導入と「配布」の課題Cybozu では、昨年(2025年)夏ごろからコーディングエージェントツールとして Claude Code を導入しておりました。今年からは Claude の Team Plan が全社展開されるようにもなり、AI ツールの活用はますます加速しています。Claude Code を使い始めると、各メンバーがそれぞれに便利なプロンプトを書いたり、MCP Server を
3日前

Vol.05 Sansan Data Intelligence CRE組織立ち上げの現在地
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第5弾です。 こんにちは。技術本部 Data Intelligence Engineering Unit Data Hubグループの髙芝です。 2025年12月のSDI(Sansan Data Intelligence)ローンチから約2カ月。これまでのブログリレーでは、SDIを支えるアーキテクチャやデータ基盤の深部についてお伝えしてきました。 本日は、その技術を「顧客の信頼」へと繋ぐための挑戦——CRE(Customer Reliability Engineering)組織の立ち上げの現在地についてお話し…
4日前

Recovering lost code Simon Willison's Weblog
<p>Reached the stage of parallel agent psychosis where I've lost a whole feature - I know I had it yesterday, but I can't seem to find the branch or worktree or cloud instance or checkout with it in.</p><p>... found it! Turns out I'd been hacking on a random prototype in <code>/tmp</code> and then my computer crashed and rebooted and I lost the code... but it's all still there in <code>~/.claude/projects/</code> session logs and Claude Code can extract ...
4日前

AIと自分のテスト分析を比較してみた
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の131週目の記事です!3年間連続達成まで残り28週となりました!こんにちは、株式会社ログラスでQAエンジニアをやっている森島です。さて、みなさん生成AI(以下、AI)を活用していますか?ログラスでもAIの活用は積極的に進めており、テスト工程における活用も例外ではありません。特に最近はテストでの活用事例が増えており、私も波に乗り遅れまいと情報を追いかけたり、実際に活用してみたりと日々奮闘中です。要求仕様書や仕様書をAIに与えてテスト分析をさせてみると、テストすべき項目やリスクを瞬時...
4日前

Claude Codeエージェント実践 Day 20|Week 3 振り返り — 1体のエージェントからチームへ
Akiraさんのフィード
今日のゴールWeek 3(Day 15-19)で取り組んだ「エージェントモデリング → n8n エージェントの育成」を振り返り、Week 2 との違いを分析する。得られた教訓を整理し、Week 4 の計画を立てる。 前提条件Day 15〜19 の記事を読んでいると背景が掴みやすい。ただし、各パターンは単独でも読めるように書いているので、「振り返り記事だけ追う」読み方でも大丈夫です。 TL;DRWeek 3 では 1体のエージェント → 2体のチーム にスコープを拡大した。単体では見えなかった「エージェント間の引き継ぎ」という課題が浮上し、スキルで解決したWeek 2...
4日前

Socket Joins the OpenJS Foundation
Socket
Socket is proud to join the OpenJS Foundation as a Silver Member, deepening our commitment to the long-term health and security of the JavaScript ecosystem.
4日前

Gemini 3.1 Pro Simon Willison's Weblog
<p><strong><a href="https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/">Gemini 3.1 Pro</a></strong></p>The first in the Gemini 3.1 series, priced the same as Gemini 3 Pro ($2/million input, $12/million output under 200,000 tokens, $4/$18 for 200,000 to 1,000,000). That's less than half the price of Claude Opus 4.6 with very similar benchmark scores to that model.</p><p>They boast about its improved SVG animatio...
4日前

GitHub、リポジトリに対するプルリクエストをコラボレーターのみに制限する、あるいは完全に無効にする設定を可能に
Publickey
GitHubは、リポジトリの設定として新たな設定を2つ追加したことを発表しました。 1つはコラボレーターのみにプルリクエストを制限する設定、もう1つは完全にプルリクエストを無効する設定です。 コラボレーターのみにプルリクエストを制限すると、...
4日前
2/19 (木)

Packaging Expertise: How Claude Skills Turn Judgment into Artifacts
Radar
Think about what happens when you onboard a new employee. First, you provision them tools. Email access. Slack. CRM. Office software. Project management software. Development environment. Connecting a person to the system they’ll need to do their job. However, this is necessary but not sufficient. Nobody becomes effective just because they can log into Salesforce. […]
4日前

What Developers Actually Need to Know Right Now
Radar
The following article includes clips from a recent Live with Tim O’Reilly interview. You can watch the full version on the O’Reilly Media learning platform. Addy Osmani is one of my favorite people to talk with about the state of software engineering with AI. He spent 14 years leading Chrome’s developer experience team at Google, […]
4日前

Advancing independent research on AI alignment
OpenAI News
OpenAI commits $7.5M to The Alignment Project to fund independent AI alignment research, strengthening global efforts to address AGI safety and security risks.
4日前

失敗から学んだ仕様駆動開発――チームの暗黙知を形式知化した1ヶ月の実践と次の課題
Timee Product Team Blog
「AIで開発生産性は劇的に上がるのか?」開発チームがcc-sddを用いた仕様駆動開発(SDD)に挑戦。手戻り減少という成果の一方で、デプロイ頻度のデータから見えてきた要件定義のボトルネックなど、リアルな実践記録と学びを紹介します。
4日前

ニッチアイテムを好むヘビーユーザーに着目した人気バイアスの緩和
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでデータサイエンティストをしている林 (@python_walker) です。この記事...
4日前

デブサミ2026 Day2 初参加レポート
カミナシ エンジニアブログ
はじめに 「カミナシ レポート」を開発しているかわりくです! 日本最大級のテックカンファレンス、Developers Summitに初参加してきました。 2日目のセッションの感想や持ち帰れそうなことをメモっております。 会場の雰囲気は、デデデデカイ!規模がデカい!今まで参加したどのカンファレンスよりも人の数と会場のキャパシティと、ブースの数が桁違い...!スタッフさんも多い...!ありがとうスタッフさん...! タダでサンドイッチもらってごめんなさい...!スタッフさんの分まで楽しみます! 興奮しながらの入場となりました。 (2026/2/19終了後、最速レポとして投稿されたものです。) be…
4日前

Claude Code の Agent Skills を活用してリポジトリのオンボーディングを効率化する
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでバックエンドエンジニアをしている小室 (@nekorush14) です。今回は、Cl...
4日前

Experimenting with sponsorship for my blog and newsletter Simon Willison's Weblog
<p>I've long been resistant to the idea of accepting sponsorship for my blog. I value my credibility as an independent voice, and I don't want to risk compromising that reputation.</p><p>Then I learned about Troy Hunt's <a href="https://www.troyhunt.com/sponsorship/">approach to sponsorship</a>, which he first wrote about <a href="https://www.troyhunt.com/im-now-offering-sponsorship-of-this-blog/">in 2016</a>. Troy runs with a simple text row in the pag...
4日前

SWE-bench February 2026 leaderboard update Simon Willison's Weblog
<p><strong><a href="https://www.swebench.com/">SWE-bench February 2026 leaderboard update</a></strong></p>SWE-bench is one of the benchmarks that the labs love to list in their model releases. The official leaderboard is infrequently updated but they just did a full run of it against the current generation of models, which is notable because it's always good to see benchmark results like this that <em>weren't</em> self-reported by the labs.</p&...
4日前

Socket Security Analysis Is Now One Click Away on npm
Socket
npm now links to Socket's security analysis on every package page. Here's what you'll find when you click through.
5日前

Kotlin Fest 2025:コードレビュー問題集 LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。Yahoo!オークションでAndroidアプリの開発を担当している高松です。2025年11月1日(土)に開催されたKotlin Fest 2025にて、LINEヤフー株式会社は「ことりプラ...
5日前

LadybirdBrowser/ladybird: Abandon Swift adoption
Simon Willison's Weblog
<p><strong><a href="https://github.com/LadybirdBrowser/ladybird/commit/e87f889e31afbb5fa32c910603c7f5e781c97afd">LadybirdBrowser/ladybird: Abandon Swift adoption</a></strong></p>Back <a href="https://simonwillison.net/2024/Aug/11/ladybird-set-to-adopt-swift/">in August 2024</a> the Ladybird browser project announced an intention to adopt Swift as their memory-safe language of choice.</p><p>As of <a href="https://github.com/LadybirdB...
5日前

場所を理由に挑戦を諦めない。Sansanが地方拠点採用を強化する理由
Sansan Tech Blog
年末に、新卒で東京に来て以来初めて引越しをしたCTOの笹川です。 引越し先も、引越し前と同じ都内ですが、今回は東京以外のSansanの地方拠点について書いてみようと思います(本題と関係ないですが、笹川は札幌出身です)。 Sansanには、渋谷にある本社オフィスの他に、たくさんの地方拠点があるのをご存知でしょうか。 この記事では、Sansanが地方拠点においてエンジニア採用を強化している理由と、地方拠点で働くメリットについてお伝えしたいと思います。 この記事を読んで少しでも興味を持った方は、以下のカジュアル面談フォームよりご応募ください。オンライン、オフライン問わず、笹川をはじめSansanのエ…
5日前

Claude Codeエージェント実践 Day 19|引き継ぎスキルと受付チェックで PLACEHOLDER を根絶する
Akiraさんのフィード
TL;DRDay 18 で設計したエージェント間インターフェースを 2つのスキルとして実装した分析エージェント → /handover(引き継ぎ書を構造化して出力する)n8n エージェント → /reception-check(情報が揃っているか検証し、不足があれば聞き返す)改善版の引き継ぎ書でワークフロー再生成したところ、Day 17 で 10 個あったエラーが 1 個に減ったエージェント間の品質は「引き継ぎの情報密度」で決まる。スキルで構造化すれば、毎回同じ品質で渡せる 作ったもの/handover スキル — 分析エージェントの SKILL.md...
5日前

Introducing OpenAI for India
OpenAI News
OpenAI for India expands AI access across the country—building local infrastructure, powering enterprises, and advancing workforce skills.
5日前

Typing without having to type Simon Willison's Weblog
<p>25+ years into my career as a programmer I think I may <em>finally</em> be coming around to preferring type hints or even strong typing. I resisted those in the past because they slowed down the rate at which I could iterate on code, especially in the REPL environments that were key to my productivity. But if a coding agent is doing all that <em>typing</em> for me, the benefits of explicitly defining all of those types are suddenly much more attractive.</p>...
5日前

The A.I. Disruption We’ve Been Waiting for Has Arrived Simon Willison's Weblog
<p><strong><a href="https://www.nytimes.com/2026/02/18/opinion/ai-software.html?unlocked_article_code=1.NFA.UkLv.r-XczfzYRdXJ&amp;smid=url-share">The A.I. Disruption We’ve Been Waiting for Has Arrived</a></strong></p>New opinion piece from Paul Ford in the New York Times. Unsurprisingly for a piece by Paul it's packed with quoteworthy snippets, but a few stood out for me in particular.</p><p>Paul describes the <a href="https://simonwillison...
5日前

Cline CLI npm Package Compromised via Suspected Cache Poisoning Attack
Socket
A compromised npm publish token was used to push a malicious postinstall script in cline@2.3.0, affecting the popular AI coding agent CLI with 90k weekly downloads.
5日前

Quoting Martin Fowler Simon Willison's Weblog
<blockquote cite="https://martinfowler.com/fragments/2026-02-18.html"><p>LLMs are eating specialty skills. There will be less use of specialist front-end and back-end developers as the LLM-driving skills become more important than the details of platform usage. Will this lead to a greater recognition of the role of <a href="https://martinfowler.com/articles/expert-generalist.html">Expert Generalists</a>? Or will the ability of LLMs to write lots of code mean they code ar...
5日前

Amazon EC2が仮想化のネスト(Nested Virtualization)に対応。KVMやHyper-Vを用いた仮想マシンを設定可能に
Publickey
Amazon Web Services(AWS)は、Amazon EC2のベアメタルインスタンス以外のインスタンスでも仮想化のネスト(Nested Virtualization)が可能になったことを発表しました。 以前からAmazon EC...
5日前

Slackが「リアルタイムサーチAPI」と「Slack MCP Server」を発表。生成AIがSlack上のやりとりを基にコンテキストを理解可能
Publickey
企業向けチャットサービスのSlackは、リアルタイムサーチAPIと、生成AIがSlackを操作できる「Slack MCP Server」の提供を発表しました。 For every type of problem and task, ther...
5日前

【イベントレポート】『ホットペッパーグルメ』を動かすデータマネジメント~アナリティクスエンジニアの挑戦と裏側~
Recruit Data Blog
はじめに こんにちは、Recruit Data Blog 担当の森です。 2026年1月20日、リクルートの飲食事業である『ホットペッパーグル
5日前
2/18 (水)

AI Is Not a Library: Designing for Nondeterministic Dependencies
Radar
For most of the history of software engineering, we’ve built systems around a simple and comforting assumption: Given the same input, a program will produce the same output. When something went wrong, it was usually because of a bug, a misconfiguration, or a dependency that wasn’t behaving as advertised. Our tools, testing strategies, and even […]
5日前

Vol.04 新規プロダクト立ち上げにデータサイエンティストチームがどう貢献するか
Sansan Tech Blog
この記事は、Sansan Data Intelligence開発Unitブログリレーの第4弾です。 はじめに 技術本部 研究開発部の小松です。Data Direction Groupに所属し、社内外のデータ活用推進に従事しています。最近は新プロダクトSansan Data Intelligence(SDI)の立ち上げに注力しています。 SDIでは、プロダクトの立ち上げ段階からデータサイエンティストで構成されるチームが参画しています。本記事では、SDIの現場でデータサイエンティストチームが実際にどのように動き、事業貢献しているかを紹介します。
5日前

Introducing EVMbench OpenAI News
OpenAI and Paradigm introduce EVMbench, a benchmark evaluating AI agents’ ability to detect, patch, and exploit high-severity smart contract vulnerabilities.
6日前

Introducing Claude Sonnet 4.6 Simon Willison's Weblog
<p><strong><a href="https://www.anthropic.com/news/claude-sonnet-4-6">Introducing Claude Sonnet 4.6</a></strong></p>Sonnet 4.6 is out today, and Anthropic claim it offers similar performance to <a href="https://simonwillison.net/2025/Nov/24/claude-opus/">November's Opus 4.5</a> while maintaining the Sonnet pricing of $3/million input and $15/million output tokens (the Opus models are $5/$25). Here's <a href="https://www-cdn.anthropic.com/78073f...
6日前

Rodney v0.4.0 Simon Willison's Weblog
<p><strong><a href="https://github.com/simonw/rodney/releases/tag/v0.4.0">Rodney v0.4.0</a></strong></p>My <a href="https://github.com/simonw/rodney">Rodney</a> CLI tool for browser automation attracted quite the flurry of PRs since I announced it <a href="https://simonwillison.net/2026/Feb/10/showboat-and-rodney/#rodney-cli-browser-automation-designed-to-work-with-showboat">last week</a>. Here are the release notes for the just-releas...
6日前

Claude Codeエージェント実践 Day 18|エージェント間の知識引き継ぎで n8n ワークフローを動かす
Akiraさんのフィード
TL;DRエージェントが生成したワークフローを実際に動かしたら 10 個のエラーが出た。原因はすべて「引き継ぎ不足」エラーを 3 カテゴリ(接続情報 / n8n 固有仕様 / 実行前提)に分類し、エージェント間のインターフェースを設計した分析エージェントに「引き継ぎ」スキル、n8n エージェントに「受付チェック」スキルを持たせれば、PLACEHOLDER 問題は構造的に解消できる 作ったもの引き継ぎ書テンプレート / 受付チェックリスト — エージェント間インターフェースの設計(本記事内に掲載)n8n-workflow-agent リポジトリ — 準備中(スキ...
6日前

Socket Brings Supply Chain Security to skills.sh
Socket
Socket is now scanning AI agent skills across multiple languages and ecosystems, detecting malicious behavior before developers install, starting with skills.sh's 60,000+ skills.
6日前

Introducing PHP and Composer Support in Socket
Socket
Socket now supports PHP with full Composer and Packagist integration, enabling developers to search packages, generate SBOMs, and protect their PHP dependencies from supply chain threats.
6日前

マイクロソフト、.NETランタイムでWebAssemblyの実行をサポートへ、CoreCLRに実装を開始
Publickey
マイクロソフトは2月10日付けで公開した.NET 11 Preview 1において、.NETランタイムでWebAssemblyの実行をサポートする作業を開始していることを明らかにしました。 完成は来年の.NET 12かそれ以後の予定 .NE...
6日前

中国アリババ、MySQLのブランチとしてInnoDBエンジン、DuckDBカラムナエンジン、ベクトルサーチなどを統合した「AliSQL 8.0」オープンソースで公開
Publickey
中国のAlibaba Cloudデータベースチームは、MySQLのブランチとしてOLTP用のInnoDB、OLAP用のDuckDBカラムナエンジン、そしてベクトルサーチ機能を統合した「AliSQL 8.0」をオープンソースで公開しました。 ...
6日前
2/17 (火)

Quoting ROUGH DRAFT 8/2/66 Simon Willison's Weblog
<blockquote cite="https://www.neatorama.com/2026/02/11/The-Original-Drafts-for-Star-Treks-Opening-Narration/"><p>This is the story of the United Space Ship Enterprise. Assigned a five year patrol of our galaxy, the giant starship visits Earth colonies, regulates commerce, and explores strange new worlds and civilizations. These are its voyages... and its adventures.</p></blockquote><p class="cite">&mdash; <a href="https://www.neatorama.com/2026/02/11/The-Ori...
6日前

First kākāpō chick in four years hatches on Valentine's Day Simon Willison's Weblog
<p><strong><a href="https://www.doc.govt.nz/news/media-releases/2026-media-releases/first-kakapo-chick-in-four-years-hatches-on-valentines-day/">First kākāpō chick in four years hatches on Valentine&#x27;s Day</a></strong></p>First chick of <a href="https://simonwillison.net/2026/Jan/8/llm-predictions-for-2026/#1-year-k-k-p-parrots-will-have-an-outstanding-breeding-season">the 2026 breeding season</a>!</p><blockquote><p>Kākāp...
6日前

Quoting Dimitris Papailiopoulos Simon Willison's Weblog
<blockquote cite="https://twitter.com/dimitrispapail/status/2023080289828831349"><p>But the intellectually interesting part for me is something else. <strong>I now have something close to a magic box where I throw in a question and a first answer comes back basically for free, in terms of human effort</strong>. Before this, the way I'd explore a new idea is to either clumsily put something together myself or ask a student to run something short for signal, and if it's th...
6日前

AI, A2A, and the Governance Gap
Radar
Over the past six months, I’ve watched the same pattern repeat across enterprise AI teams. A2A and ACP light up the room during architecture reviews—the protocols are elegant, the demos impressive. Three weeks into production, someone asks: “Wait, which agent authorized that $50,000 vendor payment at 2 am?“ The excitement shifts to concern. Here’s the […]
6日前

Vol.03 SOCv2: MasterData as a Service (MDaaS) 10年もののSystemを作り替える
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第3弾です。 こんにちは、技術本部 Data Intelligence Engineering Unitの Makoto Nagai です。 今までの記事では、Sansan Data Intelligence(SDI)の顧客が利用するSystemについて焦点を当てて紹介しましたが、今回はSDIが利用しているMaster Data Systemについて紹介したいと思います。 このMaster Data Systemは、Sansanで使われている名寄せ、識別、Master DataのSystemを作り替える目…
6日前

Next.jsでSSR専用モジュールがCSRバンドルに混入する問題をwebpackで解決する
Wantedly Engineer Blog
はじめに背景IP アドレス制限Apollo Client の構成問題: Cannot find module "f...
6日前

Nano Banana Pro diff to webcomic Simon Willison's Weblog
<p>Given the threat of <a href="https://simonwillison.net/tags/cognitive-debt/">cognitive debt</a> brought on by AI-accelerated software development leading to more projects and less deep understanding of how they work and what they actually do, it's interesting to consider artifacts that might be able to help.</p><p>Nathan Baschez <a href="https://twitter.com/nbaschez/status/2023501535343509871">on Twitter</a>:</p><blockquote><p>my cu...
6日前

Qwen3.5: Towards Native Multimodal Agents Simon Willison's Weblog
<p><strong><a href="https://qwen.ai/blog?id=qwen3.5">Qwen3.5: Towards Native Multimodal Agents</a></strong></p>Alibaba's Qwen just released the first two models in the Qwen 3.5 series - one open weights, one proprietary. Both are multi-modal for vision input.</p><p>The open weight one is a Mixture of Experts model called Qwen3.5-397B-A17B. Interesting to see Qwen call out serving efficiency as a benefit of that architecture:</p><blockquot...
6日前

なぜ、kintoneにプラットフォームエンジニアリング部は生まれたのか
Cybozu Inside Out | サイボウズエンジニアのブログ
「この部って具体的に何をするんだろう?」プラットフォームエンジニアリング部に配属されて、最初に浮かんだのはそんな戸惑いにも似た疑問でした。aki (@aki366) です。kintoneの開発部門には、「プラットフォームエンジニアリング部(以下、PfE部)」があります。社内外からも、「kintoneのPfE部って何をする部なの?」「なぜ今、このタイミングで立ち上がったの?」といった声をよく耳にしますし、それは私自身が抱いていた疑問でもありました。そこで今回、PfE部立ち上げを牽引してきたお二人に直接インタビューしました。本記事では、PfE部が生まれた背景や狙いを、対談形式でひも解く3部作のインタビューをお届けします。PfE部ができた生い立ちについてお送りします。「kintoneのPfE部って、なんだろう?」この記事の構成は以下の通りです。「この部って具体的に何をするんだろう?」自己紹介なぜ今、PfE部が生まれたのかQ. PfE部が立ち上がる前って、どんな状況だったんでしょうか?Q. もしこのままバックエンドのままだったら、厳しかったポイントってありますか?Q. PfE部を立ち上げると決
7日前

cdk8s を使ってみた! - TypeScript で Kubernetes マニフェストを管理する
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone の生成 AI チームで連載中の kintone AIリレーブログ 2026 の 4 本目の記事です。 リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone 生成 AI チームの 386jp です。突然ですが、みなさんは Kubernetes のマニフェストをどのように生成・管理していますでしょうか?ArgoCD で GitOps を実践されている方であれば、Kustomize や Helm、Jsonnet などのツールで管理されているかと思います。サイボウズでも、これらのツールを活用してマニフェストを生成していることが多いです。これらのツールは非常に強力ですが、それぞれ独自の記法が採用されており、構文でつまづくことがあるという共通の課題があります。Helm は Go テンプレートの知識が必要で、Jsonnet も独自の記法を覚える必要があり、Kustomize も overlay の仕組みでつまづくケースがあります。そこで、 kintone 生成 AI チームでは、 cdk
7日前

未来のクラウドを創る LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。クラウドサービスCBUに所属し、開発サービスを支えるプライベートクラウドを担当しているYoung Hee Parkです。LINEヤフーでは、エンジニアがサービス開発に必要とするインフラおよ...
7日前

似た商品が見つかる! Yahoo!ショッピングの類似画像検索 〜 近傍探索NGTの導入事例 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2019年7月3日)を、現在のブログへ移管したものです。内容は初出時点のものです。Yahoo!ショッピングの大元です。この度、類似画像検索のサービ...
7日前

1ミリ秒でも速く。地震の揺れを可視化する「リアルタイム震度」の処理の工夫 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2021年3月8日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。こんにちは。Yahoo!天気・災害...
7日前

Two new Showboat tools: Chartroom and datasette-showboat Simon Willison's Weblog
<p>I <a href="https://simonwillison.net/2026/Feb/10/showboat-and-rodney/">introduced Showboat</a> a week ago - my CLI tool that helps coding agents create Markdown documents that demonstrate the code that they have created. I've been finding new ways to use it on a daily basis, and I've just released two new tools to help get the best out of the Showboat pattern. <a href="https://github.com/simonw/chartroom">Chartroom</a> is a CLI charting tool that works well with...
7日前

Musubi バックエンドの Python 開発環境を mise + uv へ移行しました(思ったより簡単)
KAKEHASHI Tech Blog
Musubi 開発チームおよびサーバサイド Python 研究会の加藤です。最近は冷えますね。 私のチームで開発している Musubi のバックエンドは Python で実装されていますが、そのパッケージおよびランタイム管理の変遷を追ってみると 2017〜: requirements.txt + Docker 2022〜現在: Poetry + pyenv (via anyenv) となっていて、ここ4年ほどは変わっていません。 最近は mise や uv が流行っており 1、 しかも高速と聞いているので CI/CD の高速化も狙って導入することにしました。 Musubi バックエンドの構成 …
7日前

Claude Codeエージェント実践 Day 17|n8nエージェントにワークフローを作らせてみた
Akiraさんのフィード
TL;DR部下育成モデル Phase 2(やらせてみる)として、n8n ワークフローエージェントに初めて実タスクを与えたIssue に要件を書いて渡したら、Phase 0〜5 を自律的に進め、7ノードのワークフロー JSON + ドキュメント2点を生成したPublic API 経由のインポートでは認証トークンの違い(MCP用 vs API用)で詰まったが、エージェント自身がリトライで解決した 作ったものn8n ワークフロー「週次_地域別売上レポート」src/REQ-001/├── 週次_地域別売上レポート.json ← ワークフロー JSON(7ノード)├...
7日前

Rodney and Claude Code for Desktop
Simon Willison's Weblog
<p>I'm a very heavy user of <a href="https://code.claude.com/docs/en/claude-code-on-the-web">Claude Code on the web</a>, Anthropic's excellent but poorly named cloud version of Claude Code where everything runs in a container environment managed by them, greatly reducing the risk of anything bad happening to a computer I care about.</p><p>I don't use the web interface at all (hence my dislike of the name) - I access it exclusively through their native iPhone and Ma...
7日前

生成AIがGoogleテクノロジーの公式ドキュメントを参照できる「Developer Knowledge API & MCP Server」、Googleが発表
Publickey
Googleは、Google Cloud、Android、FirebaseなどGoogleテクノロジーの公式ドキュメントの情報を取得し、生成AIから参照できるDeveloper Knowledge APIおよびそれに対応したMCP(Mode...
7日前

クラウドインフラのシェア、AWSがトップを維持するも28%、AzureとGoogle Cloudが少しずつ差を詰めていく。2025年第4四半期、Synergy Researchの調査結果
Publickey
調査会社のSynergy Research Groupは、グローバルにおける2025年第4四半期のクラウドインフラの市場状況について調査結果を発表しました。 クラウドインフラとは、IaaS、PaaS、ホステッドプライベートクラウドを合わせた...
7日前







