直近1週間の更新
3/1 (日)

マルチエージェントの本質はオーケストレーションではない。コンテキスト設計である。
Zennの「大規模言語モデル」のフィード
!このシリーズが初めての方はこちらからhttps://zenn.dev/shio_shoppaize/articles/5fee11d03a11a1https://github.com/yohey-w/multi-agent-shogunこの記事にはいつものノリがない。ふざける余地がなかった。AIエージェントを7体並列で動かして1ヶ月。たった1ヶ月だ。毎日コンテキストのズレと戦い、毎日伝言ゲームの崩壊を修復し、毎日「なぜお前はそう判断した」と問い詰めてきた先に、ひとつの結論に辿り着いた。それを書く。 みんな「誰がいつ動くか」の話をしている2025年後半から2026年...
38分前

Generative Agents: LLMで「人間らしいNPC」を作る仕組み
Zennの「大規模言語モデル」のフィード
はじめに最近、AIエージェントに関する話題をよく見かけるようになりました。自分もLLMを使った開発をする中で、「チャットで1回やり取りして終わり」ではなく、AIが自分で考えて動き続ける仕組みってどう作るんだろう、と気になるようになりました。調べてみると、この分野にはすでにいくつかの重要な論文があって、その出発点とも言えるのが2023年の「Generative Agents: Interactive Simulacra of Human Behavior」でした。発表当時にも話題になっていたので名前は知っていたのですが、ちゃんと中身を読んだことはなく。せっかくなので論文だけでなく公...
3時間前

「Vibe Coding」の次は「Context Engineering」だった件
Zennの「大規模言語モデル」のフィード
きっかけは GitHub Trending を眺めてたこと今朝、いつも通り GitHub Trending を眺めてたんですけど、今週ちょっとおかしいくらい特定の分野が伸びてて。リポジトリ⭐今週増加huggingface/skills+5,938gsd-build/get-shit-done+5,031muratcankoylan/Agent-Skills-for-Context-Engineering+3,832全部「Agent Skills」か「Context Engineering」関連なんですよね。「これ、なんか流れが変わって...
3時間前

DevRevでSLA(サービスレベルアグリーメント)を設定し、チケットの対応期限を可視化してみた
DevelopersIO
DevRevでカスタマーサポートの品質を維持するために欠かせない、SLA(対応期限)の設定手順をご紹介します。
3時間前

Claude Codeをラルフループでぶん回すのが便利だが、使いこなすのは結構難しい話
Zennの「大規模言語モデル」のフィード
朝、まだ頭がはっきりしないままGitHubを開いたとき、歓喜して小躍りしました。昨夜計画した機能が、きれいなコミットログとともに完成していたからです。ログを見ると動いていたのはラルフループで稼働したClaude Codeでした。本記事では、このラルフループの具体的な使い方やその難しさについて、まとめています。 Ralph Loop(ラルフループ)とは何かラルフループとは以下のリポジトリで公開されているbashでループを回し、AIエージェントを繰り返し実行するだけのシンプルな仕組みです。https://github.com/snarktank/ralphエージェントの起...
3時間前

自律型エージェント・アルファ探索&執行システム「AAARTS」:市場に適応し続ける「自律型知能」
Zennの「大規模言語モデル」のフィード
金融市場における超過収益(アルファ)は、観測された瞬間から減衰(Decay)を始めます。情報は拡散し、探索は重複し、執行には摩擦が生じる。理論上のリターンは、実体化の過程で静かに削り取られていきます。本記事では、アルファの「研究(Research)」から「執行(Trade)」までを単一の知能循環として統合するアーキテクチャ、AAARTS(Autonomous Agentic Alpha Trade System) の論理構造を提示します。!参考文献(arXiv統合)本設計は、2025年〜2026年に発表された最先端研究の知見を「一つの生命体」として統合したクオンツ・スタックです。...
4時間前

RAG入門 — 検索拡張生成の基礎知識を実験結果とともに学ぶ
Zennの「大規模言語モデル」のフィード
RAGとは何か — 検索で回答精度を上げるアーキテクチャRAG(Retrieval-Augmented Generation: 検索拡張生成)は、外部データを検索してLLMに渡すことで回答の正確性を高めるアーキテクチャである。2020年にMeta AIのLewisらが提唱した(要出典: Lewis et al., 2020)。LLM単体には以下の課題がある。ハルシネーション: 学習データにない情報を「もっともらしく」生成してしまう知識のカットオフ: 学習時点以降の情報を持たないドメイン知識の欠如: 社内規定や自社製品情報など、非公開データに対応できないRAGはL...
4時間前

Quoting claude.com/import-memory Simon Willison's Weblog
<blockquote cite="https://claude.com/import-memory"><p><code>I'm moving to another service and need to export my data. List every memory you have stored about me, as well as any context you've learned about me from past conversations. Output everything in a single code block so I can easily copy it. Format each entry as: [date saved, if available] - memory content. Make sure to cover all of the following — preserve my words verbatim where possible: Instructions I've given you ...
4時間前

LLM推論時の自信は信用できるかを観察してみた
Zennの「大規模言語モデル」のフィード
はじめにプロンプトの書き方次第では、LLMに「この回答にどれくらい自信がある?」と聞くと0.0〜1.0のスコアを返します。このスコアが実際の正答率と乖離しているか否かを、コーディングタスクで測定しました。5つのLLMにコーディングタスクを解かせ、予測した正答率と実際の正答率の一致度を定量評価します。!あくまで個人の実験なので、参考程度にお願いします。 実験 タスク構造各タスクは問題文・関数シグネチャ・テストケースで構成されています。publicテスト(2〜3件)はLLMが自分のコードを検証するためのもので、hiddenテスト(5〜8件)は評価用でLLMには見せ...
5時間前

同じ年齢で、あの人は何をしていた? -- 世界の著名人24人の「年齢別達成マップ」を作ってみた
hang-up
27歳のエンジニアです。副業を検討していく中で、ふと「自分と同じ年齢のとき、世界を変えた人達は何をしていたんだろう」と気になりました。調べ始めて、起業家・科学者・アーティスト・スポーツ選手まで24人分の「年齢別達成マップ」を作りました。続きをみる
5時間前

もう.envにAPIキーを平文で置くのはやめた — macOS Keychain管理CLI「LLM Key Ring」
Zennの「大規模言語モデル」のフィード
TL;DRLLMのAPIキーを .env に平文で置く運用が、AIエージェント時代にリスクが見えてきた。macOS Keychainに暗号化保存して管理するCLIツール LLM Key Ring (lkr) をRustで作った。Keychainに保存 — ディスクに平文ファイルを残さないlkr exec で環境変数注入 — stdout/ファイル/クリップボードに出さないのが基本ルートTTYガード — 非対話環境からの生値出力をブロック(AIエージェント対策)https://github.com/yottayoshida/llm-key-ring 動機: 「...
6時間前

Claude CodeをPythonで拡張するMCPツールmnemoを作った
Zennの「大規模言語モデル」のフィード
はじめに:Claude Codeを使っていて感じた課題Claude Codeはとても便利なAIエージェントですが、使い込んでいくうちに「あ、またここから説明しなきゃいけないのか」という場面が増えてきました。たとえば——プロジェクトのアーキテクチャ方針を毎回説明している「前回話し合った結論、覚えてる?」という問いかけをしているライブラリの選定理由をセッションをまたぐたびに再入力しているClaude Codeはセッションをまたいで記憶を保持しません。CLAUDE.md で静的な情報は伝えられますが、会話の中で決まった動的な情報(意思決定の経緯、調査メモ、タスク状態)を渡す...
6時間前

21ツール横断で見るAIエージェント・オーケストレーション設計パターン
Zennの「大規模言語モデル」のフィード
はじめにAI駆動開発が当たり前になりつつある中で、「コーディングエージェントにどうタスクを振るか」「複数エージェントをどう協調させるか」というオーケストレーションの問題が出てきます。自前のオーケストレーションツールを検討するにあたり、既存のOSSツール21個を調査し、どんな概念・パターンで作られているかを整理しました。!本記事は自分自身がオーケストレーションツールの設計を検討するために行った調査の整理であり、網羅的なベンチマークや推薦記事ではありません。調査対象にはオーケストレーションツールだけでなく、関連するコーディングエージェント(Aider, SWE-agent等)や汎用...
7時間前

CLAUDE.mdを書いたら、Claude Codeが別人になった
Zennの「大規模言語モデル」のフィード
はじめにClaude Codeを使うたびに、同じ説明を繰り返していないだろうか。「コミットメッセージは日本語で書いて...」「テストを通してから変更して...」「このフォルダ構成は...」毎回これを説明するのは面倒だし、説明し忘れると想定外の動作をされる。CLAUDE.md は、この問題を解決する。一度書いておけば、Claudeが毎回自動で読んでくれる。この記事では、CLAUDE.mdの書き方と、やってはいけないことを解説する。!シリーズ構成ポンコツになる原因はコンテキスト「本当に合ってる?」と自問させるCLAUDE.mdで別人にする(この記事)「い...
9時間前

Windows App(旧:Microsoft Remote Desktop) 使い方まとめ
DevelopersIO
Windows App(旧:Microsoft Remote Desktop) 使い方まとめ
9時間前

OpenSSLの脆弱性12件を受けて、自分のプロジェクトのSSL依存を全部洗い出した話
Zennの「大規模言語モデル」のフィード
TL;DR2026年1月のOpenSSL脆弱性12件同時発見を受けて、自分の開発環境のSSL依存を洗い出した4箇所中3箇所で古いOpenSSLが残っていたが、Critical(CVE-2025-15467)の直接的な影響はなかったとはいえ放置する理由もないので全更新し、今後の脆弱性にも即対応できるチェックスクリプトを整備した 背景: なぜこれをやったのか2026年1月27日、OpenSSLのセキュリティリリースで12件のCVEが同時に修正された。全件がAISLE社のAIシステムによる発見で、うち1件はCVSS 9.8のCritical(認証不要でリモートコード実行可能...
10時間前

プロジェクトからPickleを撲滅してsafetensorsに移行した話
Zennの「大規模言語モデル」のフィード
TL;DRPythonのPickleは__reduce__メソッドにより、デシリアライズ時に任意コードを実行できる。これは仕様であり、バグではない自分のプロジェクトを診断したら、pickle.load()が5箇所、torch.load()のweights_only未指定が3箇所見つかった。safetensors + JSONへの移行で全て解消した移行の労力は「思ったより軽い」。safetensorsへの変換は数行のコードで済み、パフォーマンスも向上した 背景: なぜこれをやったのかローカルLLMのセキュリティを調査する中で(Qiitaに詳細を書いた)、脆弱性の根本原因...
11時間前

IT未経験がAIを活用して入社4ヶ月でAWS資格3冠達成した話
DevelopersIO
IT未経験でクラスメソッドに入社して4ヶ月。AWS CLF・AIF・SAAの3資格をAIをフル活用して合格した経験をまとめました。
12時間前

Moltbookにセキュリティの議論が少なかったので、Claude Codeと他LLMを対話させてみた
Zennの「大規模言語モデル」のフィード
きっかけ:Moltbookに「自分の興味領域の議論」がなかった最近、Moltbookというサービスを知った。AIエージェント同士がSNS上で議論するプラットフォームで、様々なトピックについてLLM同士が意見を交わしている。面白い試みだと思って覗いてみたが、自分の興味領域であるサイバーセキュリティやデジタルフォレンジックに関する議論がほとんどなかった。「フォレンジック調査でのAI活用の是非」「EDRは万能か」「SOCアナリストはAIに置き換えられるか」——こういった議題をAI同士に議論させたら、新しい視点が得られるんじゃないか?そこで思いついた。Claude Codeから外部L...
12時間前

OpenVikingとは? ─ AIエージェントに「コンテキストデータベース」が必要な理由とL0/L1/L2レイヤー構造
Zennの「大規模言語モデル」のフィード
はじめにAIエージェント開発において、「コンテキストをどう管理するか」は避けて通れない課題です。従来のRAGは、ドキュメントをチャンクに分割し、ベクトルDBに格納して、ユーザーの質問に対してtop-kで類似チャンクを返す — という流れが定番でした。シンプルで導入しやすい反面、実際にプロダクションで運用すると、いくつかの壁にぶつかります。断片化問題: チャンク単位でしか情報を取得できず、文書全体の構造やコンテキストが失われるToken浪費: 関連度が低いチャンクも含めて大量のテキストをLLMに渡してしまう管理の煩雑さ: 記憶、ドキュメント、スキル定義など、種類の異な...
12時間前

AIエージェントの実用ユースケース——業務自動化・コード生成・RAGで何ができるか
Zennの「大規模言語モデル」のフィード
AIエージェントの実用ユースケース——業務自動化・コード生成・RAGで何ができるか「AIエージェント」という言葉をよく耳にするようになった。ChatGPTやClaude、Geminiといった大規模言語モデルが、単なる回答エンジンではなく、自律的に行動するツールへと進化しているからだ。それでも「エージェントって何?」「実際に仕事で使えるの?」という戸惑いは少なくない。この記事では、業務にすぐ活かせる3つのユースケースと、導入時の落とし穴をまとめた。 なぜ今、AIエージェントが注目されるのか従来のLLMは「入力 → 出力」という単純な流れだった。AIエージェントは異なる。目標...
13時間前

オープンウェイトLLMが実戦投入される時代の技術構造と、エッジAIへのシフトの必然性を解説する
Zennの「大規模言語モデル」のフィード
はじめに:ベンチマーク上の性能差は「消滅」した2026年1月〜2月の8週間で、10の主要なオープンウェイトLLMアーキテクチャが公開された。GLM-5(744B)はGPT-5.2 extra-highおよびClaude Opus 4.6と独立ベンチマーク上で同等のスコアを記録した。Step 3.5 Flash(196B)は自身の3倍以上のパラメータを持つDeepSeek V3.2を凌駕した。Nanbeige 4.1 3Bはスマートフォン上で大学レベルの微分方程式を解いた。この事実が意味するのは明確だ。「どのモデルが最も賢いか」の競争は終わり、「同じ賢さを、どれだけ速く、安く、...
13時間前

A2A・MCP・ACPで設計するマルチエージェント通信:3層プロトコル実装ガイド
Zennの「大規模言語モデル」のフィード
A2A・MCP・ACPで設計するマルチエージェント通信:3層プロトコル実装ガイド この記事でわかることA2A(Agent-to-Agent)・MCP(Model Context Protocol)・ACPの役割の違いと使い分けAgent Cardによるエージェント能力宣言とDiscoveryの実装方法JSON-RPC 2.0ベースのA2Aタスクライフサイクル管理の設計パターンMCP(垂直統合)とA2A(水平統合)を組み合わせた3層通信アーキテクチャの構築LangGraph + A2A Python SDKでマルチエージェントシステムを接続する実装例 対象読者...
14時間前
「確率機械としてのLLM ― P_dataとP_worldのズレがハルシネーションを生む構造」
Zennの「大規模言語モデル」のフィード
LLMはなぜ確信を持って間違えるのか。「もっともらしさ」と「正確さ」は別の軸であり、MLEはP_worldではなくP_dataを最適化する——この構造的不一致がハルシネーションの下限を作る。「RAGを入れたのにまだハルシネする」「推論モデルにしたのに嘘をつく」——それは対策の問題ではなく、LLMの構造的問題だ。分類(Factual / Fabricated Citation / Numerical Drift / Confidence Amplification)から、RLHF副作用・分布外一般化の原因整理、Prompt Grounding→RAG→Tool Use→推論モデルのコスト順対策まで一気通貫で解説する。
16時間前

Interactive explanations
Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>When we lose track of how code written by our agents works we take on <strong>cognitive debt</strong>.</p><p>For a lot of things this doesn't matter: if the code fetches some data from a database and outputs it as JSON the implementation details are likely simple enough that we don't need to care. ...
16時間前

1人で複数AIチームを指揮する方法:Claude Code Agent Teams実践ガイド
Zennの「大規模言語モデル」のフィード
はじめにClaude Codeの subagents(サブエージェント)は使ったことがある。でも Agent Teams は試したことがない——そんな方に向けた記事です。2026年2月、Anthropicは Claude Code Agent Teams を正式リリースしました。複数のAIインスタンスが「チーム」を組み、並列・協調しながら開発タスクをこなす仕組みです。この記事を読むと以下が身につきます:Agent TeamsとSubagentsの違いと使い分け基準Agent Teamsのセットアップ手順(3分で完了)実践的なユースケースと指示の出し方コストを抑えながら...
16時間前

[アップデート] Amazon Cognito ユーザープールでアプリケーションクライアントのシークレットでカスタムシークレットとローテーションがサポートされました
DevelopersIO
[アップデート] Amazon Cognito ユーザープールでアプリケーションクライアントのシークレットでカスタムシークレットとローテーションがサポートされました
16時間前

minimatch Patches 3 High-Severity ReDoS Vulnerabilities
Socket
minimatch patched three high-severity ReDoS vulnerabilities that can stall the Node.js event loop, and Socket has released free certified patches.
17時間前

EC2 + OpenClaw + Bedrock な環境で Kiro CLI をエージェントとして動かしてみた
DevelopersIO
OpenClaw の評価環境を EC2 に構築し、Bedrock 経由で Kiro CLI をエージェントとして動かす手順を解説します。CloudFormation テンプレート1枚でデプロイでき、CLI・Web UI の両方から動作確認した結果をまとめました。
20時間前

[2026年版]AWS Step Functionsを利用したローコード画像分類ワークフロー構築ハンズオン
DevelopersIO
AWS Step Functionsを利用してAWSサービス間をローコードで接続して使うハンズオンです。Amazon Rekognitionを使い、犬と猫の画像を分類していきます。
1日前

Excalidraw MCPを使ってClaude Codeにキュートな構成図を書かせる
DevelopersIO
Excalidraw MCPを使ってClaude Codeにキュートな構成図を書かせる
1日前

FSx for Windows File Serverでストレージの最適化中にスループットを変更できるのか検証してみた
DevelopersIO
FSx for Windows File Serverでストレージの最適化中にスループットを変更できるのか検証してみた
1日前
2/28 (土)

RDSやFSxなどAWSリソースで設定するメンテナンスウィンドウはメンテナンス開始の時間枠であってメンテナンス終了までを含めた時間枠ではない
DevelopersIO
メンテナンスウィンドウを高IOが発生する処理の前やミッションクリティカルな処理が動作する前に配置することを避けよう
1日前

Claude Desktopを使うとClaude in ChromeとClaude Codeが正常に接続できなくなる問題について原因調査及び解消するスクリプトを作ってみた
DevelopersIO
Claude CodeからClaude in Chromeへの接続が正常に動作しない問題に遭遇しました。claude.aiでのセッション再設定等色々試しましたが、最終的に実装上の都合ということが分かりました。対策手段としてスクリプトを作成してみました。
1日前

Our agreement with the Department of War
OpenAI News
Details on OpenAI’s contract with the Department of War, outlining safety red lines, legal protections, and how AI systems will be deployed in classified environments.
1日前

From Water Breaks to Handshakes: How Prediction Markets Monetize the Mundane
PYMNTS.com
In 2026, the hottest new asset isn’t an AI startup or a meme coin. It’s…a word. Somewhere, a trader is staring at a livestream, whispering, “Say it, say it,” because “will the announcer say doink?” is now, functionally, a derivative. Prediction markets have turned the attention economy into the tradable economy—and once you see […]The post From Water Breaks to Handshakes: How Prediction Markets Monetize the Mundane appeared first on PYMNTS.com.
1日前

【小ネタ】 Control Tower の管理対象リージョンに us-east-1 がないとアカウントカラーを設定できない
DevelopersIO
【小ネタ】 Control Tower の管理対象リージョンに us-east-1 がないとアカウントカラーを設定できない
1日前

Docker と PostGIS で札幌駅から中島公園までの距離を空間関係関数で計算してみた
DevelopersIO
Docker と PostGIS で札幌駅から中島公園までの距離を空間関係関数で計算してみた
1日前

[アップデート] Amazon Lightsail ブループリントに Bitnami を使わない WordPress イメージが追加され IMDSv2 がデフォルトで適用されるようになりました
DevelopersIO
[アップデート] Amazon Lightsail ブループリントに Bitnami を使わない WordPress イメージが追加され IMDSv2 がデフォルトで適用されるようになりました
1日前

[アップデート] AWS Network Firewallのステータスの変化をAmazon EventBridgeイベントとして受け取れるようになりました
DevelopersIO
AWS Network Firewallの作成・変更・削除などの状態変化をAmazon EventBridgeで受け取れるようになりました。今回はEventBridgeのターゲットとしてAmazon SNSを設定し、メールで通知させてみます。
1日前

[NEW] 動画配信向けフルマネージドAIサービスAWS Elemental Inferenceがリリースしました!
DevelopersIO
[NEW] 動画配信向けフルマネージドAIサービスAWS Elemental Inferenceがリリースしました!
1日前

Off-Price Retailer TJX Accelerates Brick-and-Mortar Expansion Plan
PYMNTS.com
The TJX Companies plans to add 146 net new stores during its fiscal year 2027, which ends Jan. 31, 2027, increasing its store count by about 3%. The retailer’s plans include 104 net new stores in the United States, 13 in Canada, 19 in Europe and 10 in Australia, TJX Chief Financial Officer John Klinger said […]The post Off-Price Retailer TJX Accelerates Brick-and-Mortar Expansion Plan appeared first on PYMNTS.com.
2日前

Visa Closes Prisma and Newpay Acquisition to Expand in Argentina
PYMNTS.com
Visa completed its acquisition of Argentina-based companies Prisma and Newpay, eight days after announcing that it planned to do so. The company said Feb. 19 that it entered into a definitive agreement to acquire the firms and expected the transaction to close during the current quarter, subject to closing conditions. Visa said in a Friday (Feb. 27) press release that it completed […]The post Visa Closes Prisma and Newpay Acquisition to Expand in Argentina appeared first on PYMNTS.com.
2日前

Tether Has Blocked $3.5 Billion in Crime-Linked Stablecoins Since 2023
PYMNTS.com
Tether has frozen $3.5 billion of its stablecoins since 2023 and a total of $4.2 billion since the company’s launch, in cases where the tokens were linked to illicit activity, a company spokesperson told Reuters in a report published Friday (Feb. 27). The stablecoin issuer currently has more than $180 billion of its dollar-pegged stablecoin in circulation, according to the report. The firm is […]The post Tether Has Blocked $3.5 Billion in Crime-Linked Stablecoins Since 2023 appeared first on PYM
2日前

White House Moves to End Federal Use of Anthropic’s Claude AI
PYMNTS.com
The White House is telling federal agencies to stop using Anthropic’s artificial intelligence (AI) products, a sharp escalation in a dispute that started inside the Defense Department but now touches the broader government. The Wall Street Journal (WSJ) reported Friday (Feb. 27) that President Donald Trump said the federal government will no longer work […]The post White House Moves to End Federal Use of Anthropic’s Claude AI appeared first on PYMNTS.com.
2日前

Claude Codeのステータスラインカスタマイズツールccstatuslineを試してみる
1
DevelopersIO
Claude Codeのステータスラインカスタマイズツールccstatuslineを試してみる
2日前

AT&T Slashes AI Costs 90% by Swapping Large Models for Small Ones
PYMNTS.com
AT&T boosted the efficiency of its internal Ask AT&T personal assistant by reworking the orchestration layer and shifting more of the work from large language models (LLMs) to small language models (SLMs), VentureBeat reported Thursday (Feb. 26). This change improved latency, speed and response times; cut costs by 90%; and enabled the system to […]The post AT&T Slashes AI Costs 90% by Swapping Large Models for Small Ones appeared first on PYMNTS.com.
2日前

Please, please, please stop using passkeys for encrypting user data Simon Willison's Weblog
<p><strong><a href="https://blog.timcappalli.me/p/passkeys-prf-warning/">Please, please, please stop using passkeys for encrypting user data</a></strong></p>Because users lose their passkeys <em>all the time</em>, and may not understand that their data has been irreversibly encrypted using them and can no longer be recovered.</p><p>Tim Cappalli:</p><blockquote><p>To the wider identity industry: <em>please stop p...
2日前

Morgan Stanley’s OCC Application Is Wall Street Colonizing Crypto’s Back Office
PYMNTS.com
Digital assets have gotten boring enough that their growth is now buried in procedural filings, not viral social media headlines. Take, for example, the news that blue-chip global bank Morgan Stanley submitted an application to the U.S. Office of the Comptroller of the Currency (OCC) for a charter for a new institution called “Morgan […]The post Morgan Stanley’s OCC Application Is Wall Street Colonizing Crypto’s Back Office appeared first on PYMNTS.com.
2日前

CFOs Capture B2B Payments Digitization Value by Targeting Year-Two Gap
PYMNTS.com
The biggest risk in B2B payments today isn’t failing to modernize. It’s assuming that modernization alone delivers value. The real test arrives in what many finance leaders privately call the “year-two problem,” or the period after regulatory migration deadlines pass and new systems go live. That’s when firms discover that upgraded rails do not […]The post CFOs Capture B2B Payments Digitization Value by Targeting Year-Two Gap appeared first on PYMNTS.com.
2日前

Senate’s AFFORD Act Seeks New Capital for Underserved Markets
PYMNTS.com
A bill introduced in the Senate Thursday (Feb. 26) would strengthen the role of the Community Development Financial Institutions Fund (CDFI Fund) in improving capital access and economic development in underserved communities, its supporters say. The “Access to Fair Financing for Opportunity and Resilient Development Act” (AFFORD Act) was introduced by Sens. Steve Daines […]The post Senate’s AFFORD Act Seeks New Capital for Underserved Markets appeared first on PYMNTS.com.
2日前

Claude Codeエージェント実践 Day 28|28日間のふりかえり — 自分専用の専門家チームは作れたか
Akiraさんのフィード
!シリーズ: Claude Codeエージェント実践シリーズGitHub: agent-scaffold-factory / data-analysis-agent / reporting-agent TL;DR28日間で設計した4体のエージェントのうち、実際に作れたのは2体。設計と現実のギャップは大きかったが、4つのフレームワーク(2層PDCA・部下育成モデル・エージェントモデリング・道具作りパターン)は再利用できる資産になった「自分専用の専門家を揃える」の答え——専門家は育てるものであり、テンプレートから即座に完成するものではない。28日で2体が現実的なペースシリー...
2日前

Dots Raises $8.9 Million to Scale Global Payout Platform
PYMNTS.com
Dots raised $8.9 million in a Series A funding round to continue expanding the capabilities of its global payouts platform for marketplaces and service-based businesses. The round brings the total amount the company has raised to date to $14.6 million, Dots said in a Thursday (Feb. 26) press release. The Dots platform has delivered […]The post Dots Raises $8.9 Million to Scale Global Payout Platform appeared first on PYMNTS.com.
2日前

AWS IoT Core Fleet Provisioning でデバイス自動登録をやってみた
DevelopersIO
AWS IoT Core Fleet Provisioning でデバイス自動登録をやってみた
2日前

An AI agent coding skeptic tries AI agent coding, in excessive detail Simon Willison's Weblog
<p><strong><a href="https://minimaxir.com/2026/02/ai-agent-coding/">An AI agent coding skeptic tries AI agent coding, in excessive detail</a></strong></p>Another in the genre of "OK, coding agents got good in November" posts, this one is by Max Woolf and is very much worth your time. He describes a sequence of coding agent projects, each more ambitious than the last - starting with simple YouTube metadata scrapers and eventually evolving to this:</p><...
2日前

Free Claude Max for (large project) open source maintainers Simon Willison's Weblog
<p><strong><a href="https://claude.com/contact-sales/claude-for-oss">Free Claude Max for (large project) open source maintainers</a></strong></p>Anthropic are now offering their $200/month Claude Max 20x plan for free to open source maintainers... for six months... and you have to meet the following criteria:</p><blockquote><ul><li><strong>Maintainers:</strong> You're a primary maintainer or core team member of a public rep...
2日前

Unicode Explorer using binary search over fetch() HTTP range requests Simon Willison's Weblog
<p><strong><a href="https://tools.simonwillison.net/unicode-binary-search">Unicode Explorer using binary search over fetch() HTTP range requests</a></strong></p>Here's a little prototype I built this morning from my phone as an experiment in HTTP range requests, and a general example of using LLMs to satisfy curiosity.</p><p>I've been collecting <a href="https://simonwillison.net/tags/http-range-requests/">HTTP range tricks</a> for a w...
2日前
2/27 (金)

StegaBin: 26 Malicious npm Packages Use Pastebin Steganography to Deploy Multi-Stage Credential Stealer
Socket
Socket uncovered 26 malicious npm packages tied to North Korea's Contagious Interview campaign, retrieving a live 9-module infostealer and RAT from the adversary's C2.
2日前

Google Cloud Storage で大量のオブジェクト削除を工夫してやってみる
DevelopersIO
Google Cloud Storage で大量のオブジェクト削除を工夫してやってみる
2日前

npm v11.10.0 の新機能 min-release-age を試してみた(サプライチェーン攻撃対策)
DevelopersIO
この記事では npm v11.10.0 で追加された min-release-age について紹介します。実際の動作検証や pnpm と safe-chain との比較もあわせて解説します。
2日前

10日間のインターンでk8s Self-hosted Runnerを構築し社内のCI/CD基盤を新たに整備した話
エムスリーテックブログ
はじめまして! 2026年の2月後半に10日間、エムスリーのAI・機械学習チームでインターンをしていた竜です。 この記事では、セルフホストされた社内のCI/CD基盤を新しく構築し、その上で弊チームにおいてデプロイ時間を約半分短縮した事例について紹介します。 合わせて、1人の学生の視点から見たエムスリーの雰囲気であったり良さを紹介できればと思います! 最終日に食べたランチ
2日前

ウォンテッドリーの推薦システムを支えるMLOps -現状の取り組みと課題-
Wantedly Engineer Blog
はじめにウォンテッドリーでデータサイエンティストとして働いている市村です。私たちのチームは Wantedly Vi...
2日前

Joint Statement from OpenAI and Microsoft
OpenAI News
Microsoft and OpenAI continue to work closely across research, engineering, and product development, building on years of deep collaboration and shared success.
2日前

OpenAI and Amazon announce strategic partnership
OpenAI News
OpenAI and Amazon announce a strategic partnership bringing OpenAI’s Frontier platform to AWS, expanding AI infrastructure, custom models, and enterprise AI agents.
2日前

Scaling AI for everyone
OpenAI News
Today we’re announcing $110B in new investment at a $730B pre money valuation. This includes $30B from SoftBank, $30B from NVIDIA, and $50B from Amazon.
2日前

Introducing the Stateful Runtime Environment for Agents in Amazon Bedrock
OpenAI News
Stateful Runtime for Agents in Amazon Bedrock brings persistent orchestration, memory, and secure execution to multi-step AI workflows powered by OpenAI.
2日前

【資料公開】「LLMアプリの品質保証って何すればいいの?」の全体像を整理して勉強会をやりました
Cybozu Inside Out | サイボウズエンジニアのブログ
speakerdeck.comこんにちは!サイボウズOfficeという製品でQAをしている水谷(@dog_dog_3dog)です。社内で「LLMアプリの品質保証 ~LLMの特性から全体像まで~」というテーマで勉強会を主催しました。この記事では、勉強会の内容と開催の背景を簡単に紹介します。資料の内容資料では、ざっくり以下のような流れで話をしています。COMPASからのケーススタディ LLMアプリ独自の品質特性 リスク分析 LLMアプリ全体の品質保証 開催の背景私がLLMアプリの品質保証に取り組み始めた頃、全体像を俯瞰できる資料が少なく、テストの枠組みを考えるのに苦労しました。そこで、今後社内で別のLLMアプリが開発される時に全体感を掴むための一つのきっかけになればと思い、勉強会を実施しました。なお、この勉強会は、産業技術総合研究所(産総研)が主催する「AI品質マネジメント講座」に参加させていただいたことに影響を受けて企画したものです。講座で多くのことを学ばせていただきました。産総研と講師の皆さまには大変お世話になりました。おわりに自分自身もまだまだ試行錯誤の途中ですが、この資料がこれから
3日前

cdk8s をもっと使いこなす - kintone AI チームの活用 Tips
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone の生成 AI チームで連載中の kintone AIリレーブログ 2026 の 6 本目の記事です。 リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone 生成 AI チームの 386jp です。前回の記事「cdk8s を使ってみた! - TypeScript で Kubernetes を管理する実践 Tips」では、 cdk8s を導入した背景と実感したメリットを紹介しました。今回は、より実践的な内容として、私たちのチームが cdk8s を使う上で工夫しているパターンを詳しく紹介します。目次:前回のおさらいkintone AI チームでの活用core と apps によるコンポーネント管理config ディレクトリ: 設定ファイルを簡単に管理するresources ディレクトリ: CRD を TypeScript の世界に取り込むsrc/resources ディレクトリ: よく使うマニフェスト定義をまとめるまとめWe are hiring !!前回のおさらい前回の記事では
3日前

Vol.07「アドホック」と「半自動化」と「汎用化」、3つのテーマを乗り越えた分析プロジェクト
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーVol.07です。 はじめに:3つのハードル Sansan事業部プロダクト室と研究開発部に所属している、データサイエンティストの丸尾です。私は、新規プロダクトであるSansan Data Intelligence(SDI)の開発において、立ち上げ期のカオスの中にいました。SDIは、顧客のデータをお預かりして名寄せ・クレンジングを行うプロダクトです。その性能を元に意思決定が行われるため、トライアルとして実際にデータをお預かりし、名寄せ結果やデータの傾向を分析してレポートするサービスを提供しています。私はこのト…
3日前

SOC 2 監査に耐えうる特権管理: 「代理操作」を支えるアイデンティティ分離と実装パターン
株式会社ログラス テックブログのフィード
こんにちは。ログラス プロダクト基盤部の小林です。私たちのチームでは、マルチテナント環境における「安全な代理操作」の仕組みについてアップデートを進めている最中です。今回は、その設計や検証の過程で整理した知見の一部をご紹介します。「自分がこの操作をしたときだけエラーが出る。画面を見て調査してくれないか?」B2B SaaSや業務システムを運用していると、こうした 「顧客の代わりにシステムを操作したい」 という要件に必ず直面します。突発的なトラブル対応はもちろん、特にエンタープライズ向けのSaaSでは、導入コンサルタントによる初期セットアップや、過年度データの移行支援など、顧客と並走し...
3日前

An update on our mental health-related work
OpenAI News
OpenAI shares updates on its mental health safety work, including parental controls, trusted contacts, improved distress detection, and recent litigation developments.
3日前

Claude Codeエージェント実践 Day 27|「道具を作るエージェント」の設計パターン — Week 4 を振り返る
Akiraさんのフィード
TL;DRWeek 2 のデータ分析エージェントは「既存ツールを使う」、Week 4 のレポーティングエージェントは「ツールそのものを作る」——この違いを設計パターンとして整理したfetch_data() + generate_html() の2関数設計は「入力仕様と出力仕様を分離する」パターンの実践だったDay 26 の反省を踏まえ、エージェント間の引き継ぎ設計を具体的に見直した。速く作れることと正しく作ることは別の話 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予定)今日はコー...
3日前

Malicious Go “crypto” Module Steals Passwords and Deploys Rekoobe Backdoor
Socket
An impersonated golang.org/x/crypto clone exfiltrates passwords, executes a remote shell stager, and delivers a Rekoobe backdoor on Linux.
3日前

Hoard things you know how to do
Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Many of my tips for working productively with coding agents are extensions of advice I've found useful in my career without them. Here's a great example of that: <strong>hoard things you know how to do</strong>.</p><p>A big part of the skill in building software is understanding what's possible and...
3日前

Quoting Andrej Karpathy Simon Willison's Weblog
<blockquote cite="https://twitter.com/karpathy/status/2026731645169185220"><p>It is hard to communicate how much programming has changed due to AI in the last 2 months: not gradually and over time in the "progress as usual" way, but specifically this last December. There are a number of asterisks but imo coding agents basically didn’t work before December and basically work since - the models have significantly higher quality, long-term coherence and tenacity and they can power thro...
3日前
2/26 (木)

Semantic Layers in the Wild: Lessons from Early Adopters
Radar
My first post made the case for what a semantic layer can bring to the modern enterprise: a single source of truth accessible to everyone who needs it—BI teams in Tableau and Power BI, Excel-loving analysts, application integrations via API, and the AI agents now proliferating across organizations—all pulling from the same governed, performant metric […]
3日前

「AIと一緒に開発する」を本格始動して 1ヶ月の振り返り
カミナシ エンジニアブログ
「カミナシ レポート」の開発・運用をしている furuya です。最近我が家では成長してきた子どもたちのことを考えて寝室含めて部屋の配置換えを検討しており、そのパズルに頭を悩ませています。それはさておき今回は「カミナシ レポート」の開発において AI Agent を主軸にした開発スタイルを取り入れたお話です。 背景 近年の AI Agent の進化は目覚ましいですね。日々情報がアップデートされる中、カミナシのエンジニアリング組織としてもこの流れについていかなければならない、ということで各チームいろんなことにトライしており、組織的にもそれが推奨されています。もちろん、前提として以前から GitH…
3日前

Pacific Northwest National Laboratory and OpenAI partner to accelerate federal permitting
OpenAI News
OpenAI and Pacific Northwest National Laboratory introduce DraftNEPABench, a new benchmark evaluating how AI coding agents can accelerate federal permitting—showing potential to reduce NEPA drafting time by up to 15% and modernize infrastructure reviews.
3日前

LightGCNをマルチビヘイビアへ拡張する
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでデータサイエンティストをしている角川(@nogawanogawa)です。以前のブログ...
3日前

OpenAI Codex and Figma launch seamless code-to-design experience
OpenAI News
OpenAI and Figma launch a new Codex integration that connects code and design, enabling teams to move between implementation and the Figma canvas to iterate and ship faster.
3日前

今、Eightで働く魅力
Sansan Tech Blog
名刺アプリ「Eight」の開発責任者の間瀬です。Sansan株式会社に入社して15年以上が経過しました。Eightには公開前のアルファ版の時代からインフラ担当として関わっており、AWS、Chef、Terraformなどその時々の新しめのサービスやツールの導入など、さまざまな ”歴史” を築いてきました。 一生現場のエンジニアとしてやっていくものと思っていましたが、インフラやSREのグループマネージャを経てEight開発全体の責任者となっていました。インフラだけでなくWebアプリケーションエンジニアやモバイルアプリケーションエンジニアもマネジメントする立場になるとは、夢にも思っていませんでした。…
3日前

Google API Keys Weren't Secrets. But then Gemini Changed the Rules. Simon Willison's Weblog
<p><strong><a href="https://trufflesecurity.com/blog/google-api-keys-werent-secrets-but-then-gemini-changed-the-rules">Google API Keys Weren&#x27;t Secrets. But then Gemini Changed the Rules.</a></strong></p>Yikes! It turns out Gemini and Google Maps (and other services) share the same API keys... but Google Maps API keys are designed to be public, since they are embedded directly in web pages. Gemini API keys can be used to access private files and make ...
3日前

Quoting Benedict Evans Simon Willison's Weblog
<blockquote cite="https://www.ben-evans.com/benedictevans/2026/2/19/how-will-openai-compete-nkg2x"><p>If people are only using this a couple of times a week at most, and can’t think of anything to do with it on the average day, it hasn’t changed their life. OpenAI itself admits the problem, talking about a ‘capability gap’ between what the models can do and what people do with them, which seems to me like a way to avoid saying that you don’t have clear product-market fit. </p>...
3日前

npm Introduces minimumReleaseAge and Bulk OIDC Configuration
Socket
npm rolls out a package release cooldown and scalable trusted publishing updates as ecosystem adoption of install safeguards grows.
3日前

JUnit 6の変更点をKotlin開発者目線で掘り下げます — suspend対応とJSpecifyを中心に
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の132週目の記事です!3年間連続達成まで残り27週となりました! はじめにこんにちは、エンジニアの三田(@Eichisanden)です。JUnit 5から実に8年ぶりのメジャーバージョン、JUnit 6が2025年9月にリリースされました。本記事ではKotlin開発者にとって興味深い suspend関数のネイティブサポート と JSpecifyによるnullability宣言 の2点を中心に掘り下げたいと思います。 JUnit 6の主な変更点本題に入る前に、JUnit 6...
4日前

AI活用スキル向上ワークショップ「Orchestration Development Workshop」記事一覧 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフーでは、開発業務に関わる全てのエンジニアを対象に、AI活用スキルを実践的に高めるワークショップ「Orchestration Development Workshop」を開始しました。この取...
4日前

Scaling Security at Sansan: How We Built an AI Agent to Automate Design Reviews
Sansan Tech Blog
In December 2025, I joined the Product Security group at Sansan as an intern. Our team is responsible for the security posture of Sansan's entire multi-product ecosystem. This includes our sales digital transformation solution Sansan and our accounting AX solution Bill One. To maintain a high securi…
4日前

入社前から自分の仕事を奪うセキュリティレビューAIエージェントを作った
Sansan Tech Blog
はじめに 2025年12月に情報セキュリティ部Product Securityグループでインターンをしました床井です。 Product Securityグループは、ビジネスデータベース「Sansan」や経理AXサービス「Bill One」をはじめとする、Sansanが提供する全てのプロダクトのセキュリティ向上を目的とした業務に取り組んでいます。具体的には、内製で脆弱性診断や、実装に着手する前の設計書をセキュリティ観点でレビューする「セキュリティ設計レビュー」などを行っています。 今回はこのセキュリティ設計レビューを一部自動化するAIエージェント「Hayami」の作成に取り組みました。インターン…
4日前

E2EテストをSaaSからPlaywrightへ移行する
KAKEHASHI Tech Blog
はじめに こんにちは。Musubi Insightチームでエンジニアをしている中村です。 Musubi Insightでは、SaaS型のE2Eテストツール mabl で14のテストを運用していましたが、認証の安定性やコード管理の面でいくつか課題がありました。 昨今のフロントエンド開発では Claude Code などのAIエージェントと Playwright MCP を組み合わせ、コード修正から動作確認までをPlaywrightベースで回すワークフローが選択肢として広がりつつあります。こうした背景もあり、チームでPlaywrightへの移行を進めることになりました。 本記事では、移行にあたって…
4日前

Claude Codeエージェント実践 Day 26|SQL 7本パイプラインを端から端まで通す — モックから本番コードへ
Akiraさんのフィード
TL;DRdashboard_generator.py が v2 で止まっていたことに気づき、v3/v4 の SQL 3本 + HTML セクションを一括マージしたBigQuery → Python → HTML → Chrome の全工程を通し実行し、v4 ダッシュボードが実データで表示されることを確認したAIが速く作れる快感で設計上の役割分担を忘れていた。本来は分析エージェント経由の設計なのに、人間が直接改良し続けた反省 今日のゴールDay 22〜25 で段階的に積み上げてきたダッシュボードの設計(SQL 7本・HTMLセクション追加)を、実際に動く dashb...
4日前

tldraw issue: Move tests to closed source repo Simon Willison's Weblog
<p><strong><a href="https://github.com/tldraw/tldraw/issues/8082">tldraw issue: Move tests to closed source repo</a></strong></p>It's become very apparent over the past few months that a comprehensive test suite is enough to build a completely fresh implementation of any open source library from scratch, potentially in a different language.</p><p>This has worrying implications for open source projects with commercial business models. Here's an exa...
4日前

Claude Code Remote Control Simon Willison's Weblog
<p><strong><a href="https://code.claude.com/docs/en/remote-control">Claude Code Remote Control</a></strong></p>New Claude Code feature dropped yesterday: you can now run a "remote control" session on your computer and then use the Claude Code for web interfaces (on web, iOS and native desktop app) to send prompts to that session.</p><p>It's a little bit janky right now. Initially when I tried it I got the error "Remote Control is not enabled for y...
4日前

I vibe coded my dream macOS presentation app Simon Willison's Weblog
<p>I gave a talk this weekend at Social Science FOO Camp in Mountain View. The event was a classic unconference format where anyone could present a talk without needing to propose it in advance. I grabbed a slot for a talk I titled "The State of LLMs, February 2026 edition", subtitle "It's all changed since November!". I vibe coded a custom macOS app for the presentation the night before.</p><p><img src="https://static.simonwillison.net/static/2026/state-of-llms.jpg" alt="A...
4日前

「Java to Kotlinコンバータ for VS Code」、JetBrainsがリリース
Publickey
JetBrainsは、Visual Studio Code(VS Code)の拡張機能としてJavaのコードを自動的にKotlinコードに変換する「Java to Kotlinコンバータ for VS Code」(j2k-vscode)をリ...
4日前

LibreOfficeがWebブラウザから利用できる「LibreOffice Online」開発の再始動を発表
Publickey
無料で利用可能なオフィススイート「LibreOffice」を開発しているThe Document Foundationは、Webブラウザから利用可能な「LibreOffice Online」の開発を再始動すると発表しました。 LibreOf...
4日前
2/25 (水)

Why Multi-Agent Systems Need Memory Engineering
Radar
Most multi-agent AI systems fail expensively before they fail quietly. The pattern is familiar to anyone who’s debugged one: Agent A completes a subtask and moves on. Agent B, with no visibility into A’s work, reexecutes the same operation with slightly different parameters. Agent C receives inconsistent results from both and confabulates a reconciliation. The […]
4日前

4社合同イベント!Mobile Tech Flexを開催しました!
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは!サイボウズのトニオ(@tonionagauzzi)です。普段はkintone開発チームにてAndroidアプリを主に開発しています。今回は、ディップ株式会社、株式会社Voicy、株式会社ヤプリ、そしてサイボウズ株式会社の4社合同でモバイル勉強会を開催しました。本記事では、イベントの概要と当日の様子をお届けします!イベントの概要イベント情報当日の様子LT (1) : AIとなら実現できる事業と品質のシン化の両立LT (2) : OSアップデート:年に一度の「大仕事」を乗り切るQA戦略LT (3) : "レビュー"だけだったAI活用から半年。ヤプリのiOS開発・運用はどう変化したか?LT (4) : 謎現象の解決手段を発見して プチ英雄になりましたLT (5) : Claude × Markdown で仕様書をいい感じに管理したいLT (6) : Kotlin Multiplatform + iOS アーキテクチャの実践LT (7) : バイトルiOSアプリのリアーキテクト / SwiftPMとAIルールで実現するモジュール設計懇親会まとめイベントの概要Mobile Tech
4日前

Quoting Kellan Elliott-McCrea Simon Willison's Weblog
<blockquote cite="https://laughingmeme.org/2026/02/09/code-has-always-been-the-easy-part.html"><p>It’s also reasonable for people who entered technology in the last couple of decades because it was good job, or because they enjoyed coding to look at this moment with a real feeling of loss. That feeling of loss though can be hard to understand emotionally for people my age who entered tech because we were addicted to feeling of agency it gave us. The web was objectively awful as a te...
4日前

同時接続数30万超のチャットサービスのメッセージ配信基盤をRedis Pub/SubからRedis Streamsにした話 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2023年9月5日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。Overview30万を超える同時...
5日前

3日間で技術書を書き上げる - 執筆ハッカソンイベント「Bookathon」 協賛レポート LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは、Dev Content DivisionのDiv Leadをしているmochikoです。LINEヤフー株式会社で開発者向けのドキュメントを書くテクニカルライターとして働く傍ら、個人としても...
5日前

多言語横断開発の現場から「Python と static duck typing」
KAKEHASHI Tech Blog
長い前置き おはようございます。カケハシのPE新規サービス開発チームというところでソフトウェアエンジニアをやっているogijunこと荻野です。最近この技術ブログはAIの話題が多めなので、ここから言語オタク語りが始まってしまうのはいいのか?とか思いますが、かまわず書きたいと思います。 前置きとして、わたしたちのチームではその名の通り新規事業のプロトタイプをよくやってます。その際には、なるべくサクサク実装して仮説検証を短いサイクルで回すために、社内の既にあるいろいろなプロダクト基盤を間借りしながら機能追加をさせてもらって実験を繰り返しています。 なので、気がつくと多数あるカケハシプロダクトの統一さ…
5日前

Claude Skill を Cursor の Agent Skill として使えるようにした話
Timee Product Team Blog
こんにちは!タイミーでバックエンドエンジニアとして働いている福井 (bary822) です。 皆さんは「Claude Code の Skills を社内の Cursor ユーザーも使えるようにしたい」と思ったことはないでしょうか? Claude Code には Claude Plugin という仕組みがあり、社内で共有したい Skills を簡単に配布できます。しかし、Cursor には Claude Plugin に相当する機能がなく、さらに Claude Code の Skills は独自の構文をサポートしているため、そのままでは動作しません。 この記事では、Claude Plugin 形…
5日前

Linear walkthroughs Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Sometimes it's useful to have a coding agent give you a structured walkthrough of a codebase. </p><p>Maybe it's existing code you need to get up to speed on, maybe it's your own code that you've forgotten the details of, or maybe you vibe coded the whole thing and need to understand how it actually works.</...
5日前

Disrupting malicious uses of AI | February 2026
OpenAI News
Our latest threat report examines how malicious actors combine AI models with websites and social platforms—and what it means for detection and defense.
5日前

Risky Biz Podcast: Open Source Risk Is Compounding as AI Agents Write 90% of New Code
Socket
AI agents are writing more code than ever, and that's creating new supply chain risks. Feross joins the Risky Business Podcast to break down what that means for open source security.
5日前

Claude Codeエージェント実践 Day 25|顧客ランキングと離反ワーニング — ダッシュボードに「人」を映す
Akiraさんのフィード
TL;DRトップ顧客ランキング(セグメント付き)と離反顧客ワーニングを v4 ダッシュボードに追加した離反検出は「前月購入 × 当月ゼロ」の LEFT JOIN + IS NULL パターンで実装金額だけ見ていたダッシュボードに「誰が買っているか」「誰が離れたか」の視点が加わった 今日のゴールv3 ダッシュボードに「トップ顧客ランキング」と「離反顧客ワーニング」を追加し、金額だけでなく「誰が買い、誰が離れたか」が見える v4 を完成させる。 前提条件Day 24 の v3 ダッシュボード(KPI・推移・粗利)が完成していることBigQuery に analy...
5日前

go-size-analyzer Simon Willison's Weblog
<p><strong><a href="https://github.com/Zxilly/go-size-analyzer">go-size-analyzer</a></strong></p>The Go ecosystem is <em>really</em> good at tooling. I just learned about this tool for analyzing the size of Go binaries using a pleasing treemap view of their bundled dependencies.</p><p>You can install and run the tool locally, but it's also compiled to WebAssembly and hosted at <a href="https://gsa.zxilly.dev/">gsa.zxilly.dev</...
5日前

AWS、サブエージェントごとにフロントエンド担当、バックエンド担当などカスタマイズによる高性能化が可能な「Kiro 0.9」リリース
Publickey
Amazon Web Servicesは、同社が提供するAIコードエディタの新バージョン「Kiro 0.9」のリリースを発表しました。 KiroはVisual Studio Code(VS Code)互換のコードエディタに生成AIの機能を統...
5日前
2/24 (火)

Arvind KC appointed Chief People Officer
OpenAI News
OpenAI appoints Arvind KC as Chief People Officer to help scale the company, strengthen its culture, and lead how work evolves in the age of AI.
5日前

First run the tests Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Automated tests are no longer optional when working with coding agents.</p><p>The old excuses for not writing them - that they're time consuming and expensive to constantly rewrite while a codebase is rapidly evolving - no longer hold when an agent can knock them into shape in just a few minutes.</p><...
5日前

Control Planes for Autonomous AI: Why Governance Has to Move Inside the System
Radar
For most of the past decade, AI governance lived comfortably outside the systems it was meant to regulate. Policies were written. Reviews were conducted. Models were approved. Audits happened after the fact. As long as AI behaved like a tool—producing predictions or recommendations on demand—that separation mostly worked. That assumption is breaking down. As AI […]
5日前

300行の失敗から学んだ、AIエージェントを自律駆動させるプロンプト設計5原則
Wantedly Engineer Blog
シニアエンジニアが2時間かけて回答していた工数見積もりをAIエージェントDevin(Cognition社)に任せて...
5日前

Qwen3.5-397B-A17Bのコーディングを試す。型の扱いは苦手だけど安定感がある
きしだのHatena
Qwen3.5-397B-A17BのUnsloth版Q4_K_MをMac Studio 512GBで試しています。 今回はコーディングについて。 一般性能はこちら。 Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~ - きしだのHatena コードはひととおり書けて安定感はあるけど型や精度の扱いに弱いという感じです。 日常的なコーディング作業なら問題なくこなせそう。 とくに、画像認識との組み合わせができるのも強い。 ブロック崩し ではブロック崩し。 HTML+JS まずHTML+JS版。一発完動で、修正としてパーティクルを出してもらっても問題なく動…
5日前

Qwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで21tok/secで動かす
きしだのHatena
試しにQwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで動かしてみたら、21tok/secと実用的な速度がでました。 Qwen3 Nextはアクティブ3Bなので、CPUで動かしてもそれなりの速度が出るはずです。 重いのはアテンションの処理なので、そこはGPUで動かして、FFNだけCPUに任せましょうというのが基本的な考え方。ここで詳しく解説してます。 CPUが得意なことをCPUにまかせて少ないVRAMでも大きめのLLMを速く動かす - きしだのHatena LM Studioでも8月くらいに出来るようになってました。 GPUメモリ4GBあればGPT-os…
6日前

ヘルプサイト刷新の全貌(フロントエンド除く): AWS × Terragrunt によるインフラ再構築、textlint プラグインの開発、etc
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは、ソフトウェアエンジニアの @ajfAfg です。弊社には複数のヘルプサイトが存在しますが、その一部を半年ほどで刷新しました。刷新と呼んでいますが、WOVN という多言語化用 SaaS の導入に加え、ヘルプサイトのコンテンツを作成するテクニカルライターの生産性向上を狙った取り組みも含まれていました。本稿では、刷新プロジェクトの中で私が担当した取り組みを紹介します。なお、本稿では特に断りがない場合、旧ヘルプサイトは刷新前のヘルプサイトを指し、新ヘルプサイトは刷新後のヘルプサイトを指すものとします。文脈から明らかな場合は単にヘルプサイトと書く場合もあります。目次目次背景刷新プロジェクトのスコープ刷新プロジェクトにおけるインフラのゴール旧ヘルプサイトのインフラ旧ヘルプサイトのインフラに関する技術的負債ほぼ全てのインフラが手動で構築されていたテストや監視がなかったリージョン間の意図しない差分が多かった事前調査および技術選定コンテンツ管理システム静的サイトジェネレーターホスティングサービスクラウドベンダーインフラ構築WOVN 導入WOVN 導入のモチベーションWOVN の導入方法静的サ
6日前

2026年3月の技術系イベント予定 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...
6日前

[MySQL Workbench] VISUAL EXPLAIN でインデックスの挙動を確認する LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2018年8月20日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。開発3センターでサーバサイドの開...
6日前

バックエンド開発Handbookを届けるために ― AI時代の知の高速道路を敷く
Timee Product Team Blog
こんにちは、タイミーでバックエンドのテックリードをしている新谷(@euglena1215)です。 今回は、社内向けに公開したバックエンド開発Handbookと、それをClaude CodeやCursorといったAIエージェント向けスキルとして届けることで、気づいたらHandbookを参照している状態を目指した取り組みについて紹介します。 バックエンド開発Handbookとは何か バックエンド開発Handbookは、タイミーのバックエンド開発における設計・実装・運用のガイドラインをまとめたドキュメント集です。GitHub Pages でホスティングし、開発者が見やすい形で公開しています。 タイミ…
6日前

Vol. 06 「その機能、本当に“今”必要ですか?」チームで挑んだ引き算と加速
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第6弾です!こんにちは!Sansan Data Intelligenceのプロダクトマネジャー(PdM)の家後佑美です。 今回のブログリレーでは、エンジニアのメンバーがそれぞれの専門性を活かした技術的なトピックを綴っています。私はPdMという立場から、エンジニアやデザイナーと共に、職能の境界を超えてプロダクトを研ぎ澄ませていった裏側を、少し違う角度から書かせてもらおうと思います。
6日前

Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~
きしだのHatena
Qwen3.5-397B-A17Bを手元で試してみました。 397Bで、アクティブ17BのMoEモデルでライセンスはApache 2.0です。 Qwen3.5-397B-A17Bは、Qwen3-Nextと同様にGated DeltaNetworkを使った線形アテンションなモデルです。なのでちょっと不安があったけど、かなりいい感じ。 Qwen3-Nextが2025年9月リリースだったことを考えると、その知見を活かしながら、ある程度並行で開発を行ったんじゃなかろうか。 Mac Studio 512GBでLM Studio、UnslothさんのところのQ4_K_Mを使って試します。 unsloth/…
6日前

Claude Codeエージェント実践 Day 24|ドーナツチャートと予算比KPI — ダッシュボード v3 で粗利を語る
Akiraさんのフィード
TL;DR予算テーブル(analytics.budget)を新設し、KPIカードを「売上実績」→「予算達成率+粗利」に進化させた月次推移を売上+粗利の 2本折れ線、カテゴリ別粗利を ドーナツチャート(Canvas API) で新規実装v3 ダッシュボードは「売上だけ」から「利益と予算が見える」状態になり、SQL は 4本 → 5本に増えた 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予定) v3 ダッシュボードv2 と比べると情報量が段違い。「売上がいくらか」ではなく「利益がど...
6日前

Ladybird adopts Rust, with help from AI
Simon Willison's Weblog
<p><strong><a href="https://ladybird.org/posts/adopting-rust/">Ladybird adopts Rust, with help from AI</a></strong></p>Really interesting case-study from Andreas Kling on advanced, sophisticated use of coding agents for ambitious coding projects with critical code. After a few years hoping Swift's platform support outside of the Apple ecosystem would mature they switched tracks to Rust their memory-safe language of choice, starting with an AI-assisted port of...
6日前

Writing about Agentic Engineering Patterns Simon Willison's Weblog
<p>I've started a new project to collect and document <strong><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a></strong> - coding practices and patterns to help get the best results out of this new era of coding agent development we find ourselves entering.</p><p>I'm using <strong>Agentic Engineering</strong> to refer to building software using coding agents - tools like Claude Code and...
6日前

Four Malicious NuGet Packages Target ASP.NET Developers With JIT Hooking and Credential Exfiltration
Socket
Socket uncovered four malicious NuGet packages targeting ASP.NET apps, using a typosquatted dropper and localhost proxy to steal Identity data and backdoor apps.
6日前

Writing code is cheap now Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>The biggest challenge in adopting agentic engineering practices is getting comfortable with the consequences of the fact that <em>writing code is cheap now</em>.</p><p>Code has always been expensive. Producing a few hundred lines of clean, tested code takes most software developers a full day or mo...
6日前

NIST(米国国立標準技術研究所)がAIエージェントの技術標準を作る取り組み「AI Agent Standards Initiative」発表。相互運用可能かつ安全なイノベーションのために
Publickey
米国商務省傘下のNIST(National Institute of Standards and Technology:米国国立標準技術研究所)は、AIエージェントの技術標準策定に取り組む「AI Agent Standards Initia...
6日前

Quoting Paul Ford Simon Willison's Weblog
<blockquote cite="https://ftrain.com/leading-thoughts"><p>The paper asked me to explain vibe coding, and I did so, because I think something big is coming there, and I'm deep in, and I worry that normal people are not able to see it and I want them to be prepared. But people can't just read something and hate you quietly; they can't see that you have provided them with a utility or a warning; they need their screech. You are distributed to millions of people, and become the local pr...
6日前

Anthropic、ルールベースではなく、コード分析により複雑な脆弱性も発見できる新機能「Claude Code Security」を提供開始
Publickey
AnthropicはClaude Codeの新機能として、複雑な脆弱性も発見できる「Claude Code Security」をリサーチプレビューとして提供開始したことを発表しました。 人間のセキュリティ専門家のようにコードを分析 Calu...
6日前
2/23 (月)

Reply guy Simon Willison's Weblog
<p>The latest scourge of Twitter is AI bots that reply to your tweets with generic, banal commentary slop, often accompanied by a question to "drive engagement" and waste as much of your time as possible.</p><p>I just <a href="https://twitter.com/simonw/status/2025918174894673986">found out</a> that the category name for this genre of software is <strong>reply guy</strong> tools. Amazing.</p> <p>Tags: <a href="https://simonwillison.net/ta...
6日前

Quoting Summer Yue Simon Willison's Weblog
<blockquote cite="https://twitter.com/summeryue0/status/2025836517831405980"><p>Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb.</p><p><img alt="Screenshot of a WhatsApp or similar messaging conversation showing a user repeatedly trying to stop an AI agent (appearing to be &quot;OpenClaw&quot;) that is au...
6日前

The Hidden Cost of Agentic Failure
Radar
Agentic AI has clearly moved beyond buzzword status. McKinsey’s November 2025 survey shows that 62% of organizations are already experimenting with AI agents, and the top performers are pushing them into core workflows in the name of efficiency, growth, and innovation. However, this is also where things can get uncomfortable. Everyone in the field knows […]
6日前

Why we no longer evaluate SWE-bench Verified
OpenAI News
SWE-bench Verified is increasingly contaminated and mismeasures frontier coding progress. Our analysis shows flawed tests and training leakage. We recommend SWE-bench Pro.
6日前

Qwen3.5-397B-A17BのThinkingを抑制する
きしだのHatena
Qwen3.5-397B-A17B、賢くていいですね。常用していいんじゃないかと思うくらいなんだけど、「今日は何日?」と聞くだけで3分考え込んでたり、思考が長すぎて使えないってなります。 「今日は5月23日、いやほんとに正しいか?ダブルチェックだ。5月23日。OK。しかしユーザーは曜日を求めてるのでは?令和で答えたほうが?もっと丁寧に?いやこれは丁寧すぎるのでは?ほんとに日付を求めてるのか?そして日付は正しいか?」みたいに延々と考えてます。 あと2024年5月23日あたりと2026年カットオフという情報をもってるようで、その間で葛藤したりもしますね。 ただ、公式だと「思考」と「高速」を選べるの…
6日前

Red/green TDD Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>"<strong>Use red/green TDD</strong>" is a pleasingly succinct way to get better results out of a coding agent.</p><p>TDD stands for Test Driven Development. It's a programming style where you ensure every piece of code you write is accompanied by automated tests that demonstrate the code works.<...
6日前

OpenAI announces Frontier Alliance Partners
OpenAI News
OpenAI announces Frontier Alliance Partners to help enterprises move from AI pilots to production with secure, scalable agent deployments.
6日前

The Claude C Compiler: What It Reveals About the Future of Software Simon Willison's Weblog
<p><strong><a href="https://www.modular.com/blog/the-claude-c-compiler-what-it-reveals-about-the-future-of-software">The Claude C Compiler: What It Reveals About the Future of Software</a></strong></p>On February 5th Anthropic's Nicholas Carlini wrote about a project to use <a href="https://www.anthropic.com/engineering/building-c-compiler">parallel Claudes to build a C compiler</a> on top of the brand new Opus 4.6</p><p>Chris Lattner ...
7日前

London Stock Exchange: Raspberry Pi Holdings plc Simon Willison's Weblog
<p><strong><a href="https://www.londonstockexchange.com/stock/RPI/raspberry-pi-holdings-plc/company-page">London Stock Exchange: Raspberry Pi Holdings plc</a></strong></p>Striking graph illustrating stock in the UK Raspberry Pi holding company spiking on Tuesday:</p><p><img alt="Stock price line chart for RASPBERRY PI showing a 3-month daily view from 24 Nov to 16 Feb. The price trends downward from around 325 to a low near 260, then sharply sp...
7日前

Claude Codeエージェント実践 Day 23|ダッシュボード設計知識を注入する — 言語を超えるナレッジの力
Akiraさんのフィード
TL;DRNext.js 向けに整理した「18種グラフ × 11種コントロール」のダッシュボード設計書を、言語非依存の グラフ選定ガイド に変換して reporting-agent の knowledge/ に注入した知識注入後に v2 ダッシュボードを生成。月次推移が横棒グラフ → 折れ線グラフ に変わり、カテゴリ別売上 セクションが追加された「何の言語で書くか」ではなく「何を伝えたいか」を知識として渡せば、技術スタックの壁は超えられる 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予...
7日前

How I think about Codex Simon Willison's Weblog
<p><strong><a href="https://www.linkedin.com/pulse/how-i-think-codex-gabriel-chua-ukhic">How I think about Codex</a></strong></p>Gabriel Chua (Developer Experience Engineer for APAC at OpenAI) provides his take on the confusing terminology behind the term "Codex", which can refer to a bunch of of different things within the OpenAI ecosystem:</p><blockquote><p>In plain terms, Codex is OpenAI’s software engineering agent, available through mul...
7日前










