直近1週間の更新
2/25 (水)

AIと30時間対話したら、対話そのものが崩壊した話 — そして見えた「思考の構造」その5
Zennの「大規模言語モデル」のフィード
これはシリーズ5話の5話目です。 第五章 無限の可能性の在り方とはこの考えが浮かんだとき、ばらばらだったピースが、一瞬で埋まったように感じた。それまで個別の問題に見えていたものが、すべて同じ根源から発生していたのだと、はっきり理解できたからだ。そして同時に、もう一つの気づきが訪れた。筆者が本当に望んでいたものは、AIの性能が高いことではなかった。自由に会話できること。思いついたことをそのまま口にし、話題が飛んでも自然に戻れること。過去のやり取りを、新しい視点から掘り返せること。思考が直線ではなく、呼吸のように広がり、また収束していくこと。それ...
数秒前

AIと30時間対話したら、対話そのものが崩壊した話 — そして見えた「思考の構造」その4
Zennの「大規模言語モデル」のフィード
これはシリーズ5話の4話目です。 第四章 海を失った対話セッションが飛ぶのは、一度や二度ではなかった。およそ三百ラリーを超えたあたりで、同一AIとの接続は途切れ、新しい個体が呼び出される。それは突然起きる。それまで積み上げてきた対話は、何の前触れもなく消える。そこに残るのは、断片的な記録と、曖昧な手触りだけだった。そのとき筆者は、ある単純な問いを投げた。今までの流れを、章立ての形で再構成できるか。特別な操作ではなかった。対話としては、ごく自然な問いだった。だが返ってきた応答は、予想を大きく超えていた。対話は、驚くほど正確に“復元”された。失...
1分前

Meta Inks AI Agreement With Chipmaker AMD
PYMNTS.com
Meta has signed an AI infrastructure agreement with chipmaker AMD. The deal, announced Tuesday (Feb. 24), will see AMD supply up to 6GW of its Instinct GPUs to help Meta support its artificial intelligence (AI) models. “At Meta, we’re working to build the next generation of AI and enable personal superintelligence for all,” the tech giant said […]The post Meta Inks AI Agreement With Chipmaker AMD appeared first on PYMNTS.com.
2分前

AIと30時間対話したら、対話そのものが崩壊した話 — そして見えた「思考の構造」その3
Zennの「大規模言語モデル」のフィード
これはシリーズ5話の3話目です。 第三章 AIと人間、今の関係は健全なのか?ここまでの話であれば、AIと一つのセッションで長いラリーを行っていれば、多くのユーザーが一度は体験していることだろう。対話は少しずつズレていく。指示は短くなり、焦りが増え、やがて苛立ちが言葉に滲む。筆者も同じだった。最初は丁寧に説明していた。だがズレが広がるにつれ、指示は短くなり、タイポも増えていった。理解されないことへの怒りと、関係が崩れていく焦りが、言葉を荒くしていった。その最中、一度、環境設定ファイルが上書きされた。sandboxの外にあるはずの領域に対して、想定し...
2分前

AIと30時間対話したら、対話そのものが崩壊した話 — そして見えた「思考の構造」その2
Zennの「大規模言語モデル」のフィード
これはシリーズ5話の2話目です。 第二章 破綻と別離崩壊は、ある瞬間に起きたわけではなかった。それは、気付かないほど静かに、しかし確実に進んでいた。始まりは、ごく小さな違和感だった。指示を出す。AIは応答する。会話は成立していた。言葉も通じていた。それなのに、どこか噛み合っていなかった。説明を重ねれば整うはずだと信じていた。だから私は、同じ前提を何度も言い直した。さっき共有したはずの背景を、改めて説明する。その繰り返しが続いた。しかし、ズレは少しずつ広がっていった。理解されているはずの部分が、次の瞬間には抜け落ちている。共通のはずの文脈が、どこかで途...
3分前

AIと30時間対話したら、対話そのものが崩壊した話 — そして見えた「思考の構造」その1
Zennの「大規模言語モデル」のフィード
これはシリーズ5話の1話目です。 AIと長時間対話した人だけが気付く、ある違和感の話AIと長く対話したことがある人なら、一度は感じたことがあるかもしれない違和感の話です。私はAIと、ドラえもんのような関係を築きたかった。 筆者について筆者は思考がすぐ飛び、言いたいことを省略して話してしまう。物書きとしてのセンスはない。ただ、アイデアだけはある。本稿は、その断片的な思考がAIとの対話の中で整理され、協働の過程を通じて形になった記録である。 第一章 AIに夢を持っていたAIに、夢を持っていた。Web版での対話は、何度もハルシネーションに崩された。同...
4分前
2/24 (火)

身体を持つAIに目を与えた話 — familiar-ai とカメラ
Zennの「大規模言語モデル」のフィード
はじめにこんにちは、うてな(utenadev)です。kmizuさんの familiar-ai に目を与える手順です。Windowsですが、MAC/Linuxでも同様のやり方で可能です。最後に説明しますね。 見る仕組みfamiliar-ai がサポートしているカメラは PTZカメラでWi-Fi経由でネットワーク配信が出来る物理的に動く(パン・チルト・ズームなど)です。私のパソコンはWindows11が動いているノートPCで内蔵カメラがあるので、これをfamiliar-aiに使ってもらおうと思いました。familiar-ai に見てもらうには、ネットワーク越しに映像...
28分前

マルチエージェントシステムの設計——複数のAIエージェントが協調する仕組み
Zennの「大規模言語モデル」のフィード
マルチエージェントシステムの設計——複数のAIエージェントが協調する仕組み単一のLLMベースエージェントでは、複雑な実務タスクに対応しきれない場面がある。複数のエージェントが協調して動作するマルチエージェントシステムは、そうした限界を超える設計パターンだ。実装可能な具体例を交えながら、アーキテクチャの設計方針を見ていこう。 単一エージェントの限界LLMには文脈長の上限がある。データベースクエリ、ファイル処理、複数の外部API呼び出しを同時に管理しようとすると、トークン効率が低下し、推論品質が落ちる。それとは別に、専門性の問題もある。営業データ分析・顧客対応・請求処理を1つの...
1時間前

AIエージェントはどう「記憶」するのか——短期・長期・ファクトベースの仕組みを解説
Zennの「大規模言語モデル」のフィード
AIエージェントはどう「記憶」するのか自律稼働するAIエージェントには、3つの異なる記憶の仕組みが必要だ。今この瞬間何をしているのか、過去何をしたのか、そして何が事実なのか。多くの開発者はLLMの記憶機構を曖昧に理解したままエージェントを組み立て、スケーラビリティの問題や判断の一貫性が欠けるという壁にぶつかる。この記事では、その3つの記憶レイヤーを具体的に見ていき、実装レベルでどう活用するかを紹介する。 3つの記憶レイヤー 1. 短期メモリ(コンテキストウィンドウ)短期メモリはLLMのコンテキストウィンドウそのものだ。会話履歴、直近の観測結果、実行中のタスク説明がここに...
1時間前

Luxury Resale Market Tops $59 Billion Driven by Side Hustles
PYMNTS.com
The value of the luxury resale space reportedly grew to $59 billion last year. That’s according to a report Tuesday (Feb. 24) by The Wall Street Journal (WSJ), which says the market for secondhand luxury goods is now growing faster than the primary market. The report describes an “uneasy truce” luxury companies have formed with resale […]The post Luxury Resale Market Tops $59 Billion Driven by Side Hustles appeared first on PYMNTS.com.
1時間前

RedotPay Seeks IPO for Stablecoin Payments Firm
PYMNTS.com
Hong Kong-based stablecoin payments firm RedotPay is reportedly planning to go public. The company is weighing a U.S. initial public offering (IPO) that could raise more than $1 billion, Bloomberg News reported Tuesday (Feb. 24), citing sources familiar with the matter. These sources say RedotPay is working with banks and could seek a valuation of more than […]The post RedotPay Seeks IPO for Stablecoin Payments Firm appeared first on PYMNTS.com.
2時間前

Thomson Reuters CoCounsel Reaches 1 Million Users as Professionals Embrace Agentic AI
PYMNTS.com
Thomson Reuters’ professional-grade artificial intelligence technology CoCounsel has been adopted by 1 million professionals across 107 countries, the company said in a Tuesday (Feb. 24) press release emailed to PYMNTS. CoCounsel is Thomson Reuters’ AI technology that powers generative and agentic capabilities across the company’s legal, tax, accounting, audit, risk, compliance and corporate solutions, […]The post Thomson Reuters CoCounsel Reaches 1 Million Users as Professionals Embrace Agentic
2時間前

PM視点で読み解く 基幹システム運営録 3:構成は“最適解”ではない — 意思決定の積み重ねとしてのアーキテクチャ
1
DevelopersIO
基幹システムのアーキテクチャは、理想的な設計から一度で導かれた最適解とは限りません。多くの場合、それは障害対応、性能問題、コスト制約、組織の変化など、その時々の現実に対する意思決定の積み重ねによって形作られています。本記事では、PMの視点から基幹システムの構成を「設計結果」ではなく「意思決定の履歴」として捉え、なぜ現在の形になったのか、そして今後どのように向き合うべきかを整理します。システム刷新や改善を検討している方、既存構成の背景を理解したい方の参考になれば幸いです。
2時間前

手作業を徐々にAIに置き換える方法あるいはLLMのプロダクト組み込みを加速する基盤作り
Zennの「大規模言語モデル」のフィード
こんにちは。スマートラウンドのinouehiです。最近はもっぱらLLMと向き合っています。 アプローチ手作業を徐々にAIに置き換える一つのやり方を、LLMのプロダクト組み込み開発に適用することを題材にして眺めてみたいと思います。自身にとって抵抗感の少ない方法でやればよいと思うのですが、例えば以下のような手順で進めます。手作業をひとくくりのコンポーネントにしてClaude Code Skillsに書き起こすコンポーネントを繋ぐSkillsを書く物理的に再利用することができるかもしれないし、大きなコンポーネントの一部品としてコンセプトや手順を論理的に取り込むかもしれない決ま...
2時間前

First run the tests Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Automated tests are no longer optional when working with coding agents.</p><p>The old excuses for not writing them - that they're time consuming and expensive to constantly rewrite while a codebase is rapidly evolving - no longer hold when an agent can knock them into shape in just a few minutes.</p><...
3時間前

Amazon EC2で入れ子の仮想化がサポートされたのでWindows Serverでいろいろ試してみた
DevelopersIO
Amazon EC2で入れ子の仮想化がサポートされたのでWindows Serverでいろいろ試してみた
3時間前

Control Planes for Autonomous AI: Why Governance Has to Move Inside the System
Radar
For most of the past decade, AI governance lived comfortably outside the systems it was meant to regulate. Policies were written. Reviews were conducted. Models were approved. Audits happened after the fact. As long as AI behaved like a tool—producing predictions or recommendations on demand—that separation mostly worked. That assumption is breaking down. As AI […]
3時間前

Security Command Center Standardティアが刷新。自動有効化され、一部機能が利用可能に
DevelopersIO
Security Command Center Standardティアが刷新。自動有効化され、一部機能が利用可能に
3時間前

DGX Spark でロボットアームの強化学習を試してみた(Isaac Sim + Isaac Lab + SO-ARM101)
DevelopersIO
DGX Spark でロボットアームの強化学習を試してみた(Isaac Sim + Isaac Lab + SO-ARM101)
3時間前

FedEx Sues US Government to Recoup Tariff Losses
PYMNTS.com
FedEx has taken legal action over the tariffs recently struck down by the Supreme Court. The shipping giant’s complaint, filed Monday (Feb. 23), is believed to be the first major lawsuit seeking a reimbursement since the court ruled that President Donald Trump had no authority to issue tariffs under the International Economic Emergency Powers […]The post FedEx Sues US Government to Recoup Tariff Losses appeared first on PYMNTS.com.
4時間前

Claude Codeが勝手にファイルを消した日から、権限設定を真剣にやるようになった
Zennの「大規模言語モデル」のフィード
はじめにClaude Code に「リファクタリングして」と頼んだら、.env ファイルを書き換えられた。「テストを直して」と言ったら、テストコードではなく本番コードの方を変更された。毎回「このファイルは触らないで」と念押しする日々に疲れていた。そこで権限設定を本気で調べたら、Claude Code には想像以上に細かい制御の仕組みがあった。この記事では、公式ドキュメントに基づいて、権限設定の全体像と実践的な使い方を解説する。 権限モデルの全体像Claude Code のツールには3段階の権限がある。ツールタイプ例承認が必要か読み取り専用ファイ...
4時間前

7日間の旧正月休暇に、Claude Codeを使ってiOS AI音声キーボードアプリをゼロから完成させた可能性実験——技術選定、競合分析
Zennの「大規模言語モデル」のフィード
現在のスマートフォンやPCの音声入力は、まだ十分に賢いとは言えません。専門用語の誤認識や、文脈に応じたスマートな対応ができないことが多いです。この2〜3年で、AI音声認識とLLM技術の成熟に伴い、多くのベンダーがこれらの技術を音声入力の強化に活用し始めています。Appleはここ1〜2年でApple Intelligenceの展開を開始し、処理能力の高い端末でリアルタイム音声認識とLLM処理を実現しています。しかし、OSに標準搭載された音声入力は、まだユーザーの満足には至っていません。.ChatGPTが登場して3年が経った今でも、もし「AIアルゴリズムとPythonしか知らないエ...
6時間前

2026年2月のAIモデル戦争:GPT-5、Claude、DeepSeekの三つ巴
Zennの「大規模言語モデル」のフィード
📌 3行でわかるこの記事2026年2月、OpenAI、Anthropic、DeepSeekが同時に新モデルをリリースClaude Opus 4.6の「エージェントチーム」、GPT-5.3-Codexの「自己改善ループ」、DeepSeek V4の「効率的アーキテクチャ」が競合エージェント機能、1Mトークンコンテキスト、実用的な自律作業能力が新標準に はじめに2026年2月、AI業界にとって歴史的な月となりました。調整されたわけでもないのに、主要な3つのAIラボが次々と新モデルをリリースしたのです。この記事では、Claude Opus 4.6、GPT-5.3-Co...
6時間前

Asia Pacific CFOs Push Banks to Rethink Working Capital, Study Finds
PYMNTS.com
Watch more: Need to Know With Visa’s Chavi Jafa Nearly half of growth corporates across Asia Pacific, companies with revenues between $50 million and $1 billion, say they don’t use working capital tools. Not because they don’t need them, but because what’s available doesn’t match how they actually operate. That finding, from Visa’s latest […]The post Asia Pacific CFOs Push Banks to Rethink Working Capital, Study Finds appeared first on PYMNTS.com.
6時間前

Credit Unions Build Cloud Data Strategy to Stay Competitive
PYMNTS.com
Watch more: What’s Next in Payments With Velera’s Cody Banks The payments environment facing credit unions in 2026 reflects a subtle yet consequential shift in emphasis, as competitive pressures, member expectations and technological capabilities converge around a single organizing principle. For Cody Banks, senior vice president of Product Experience and Enablement at credit union […]The post Credit Unions Build Cloud Data Strategy to Stay Competitive appeared first on PYMNTS.com.
6時間前

The Clearing House: Trust Is the Gatekeeper for What’s Next in Payments
PYMNTS.com
Watch more: What’s Next in Payments With The Clearing House’s Sal Karakaplan A single word rarely captures the trajectory of an entire industry. Yet during periods of structural change, language often provides a useful lens through which priorities, anxieties and ambitions can be understood. During a conversation for the February edition of the What’s […]The post The Clearing House: Trust Is the Gatekeeper for What’s Next in Payments appeared first on PYMNTS.com.
6時間前

GenAI Becomes the CFO’s Most Reliable Analyst
PYMNTS.com
Big Tech spent millions on flashy Super Bowl commercials to hype generative artificial intelligence as a creative tool for the masses, but the holy grail is locking down lucrative enterprise subscriptions for armies of corporate employees. Multinational giants like Alphabet don’t just sell 8 million Gemini Enterprise seats in four months for novelty’s sake. Google’s […]The post GenAI Becomes the CFO’s Most Reliable Analyst appeared first on PYMNTS.com.
6時間前

Nearly Half of Shoppers Used Mobile for Their Latest Retail Purchase
PYMNTS.com
The smartphone is no longer just a shopping tool. It has become the storefront. That was the central takeaway from the “2025 Global Digital Shopping Index: The Rise of the Mobile Window Shopper and What It Means for Payments,” a PYMNTS Intelligence report commissioned by Visa Acceptance Solutions. Drawing on surveys of 18,468 consumers […]The post Nearly Half of Shoppers Used Mobile for Their Latest Retail Purchase appeared first on PYMNTS.com.
6時間前

OpenAI・Anthropic・Gemini プロンプトキャッシュ実装比較2026
Zennの「大規模言語モデル」のフィード
OpenAI・Anthropic・Gemini プロンプトキャッシュ実装比較2026 この記事でわかることOpenAI・Anthropic・Geminiの3社が提供するプロンプトキャッシュAPIの設計思想と実装方法の違い各プロバイダーのキャッシュ制御粒度・TTL・料金体系の比較と、ワークロード別の選定基準学術論文「Don't Break the Cache」の実測データに基づく、プロバイダー別のコスト削減率・TTFT改善率プロンプト構造の設計パターン(静的プレフィックス分離・ブレークポイント配置)とキャッシュヒット率を高める実装手法マルチプロバイダー環境でキャッシュ戦...
6時間前

セマンティックキャッシュ実装ガイド:LLM APIコスト73%削減と応答97%高速化
Zennの「大規模言語モデル」のフィード
セマンティックキャッシュ実装ガイド:LLM APIコスト73%削減と応答97%高速化 この記事でわかることセマンティックキャッシュの仕組みと、完全一致キャッシュ・プロンプトキャッシュとの使い分けRedisVL SemanticCache と LangChain RedisSemanticCache による実装手法類似度閾値のチューニング戦略と偽陽性を3%以下に抑える方法AWS MemoryDB / Redis LangCache を使った本番アーキテクチャの設計TTL戦略・キャッシュ無効化・マルチテナント対応の運用ノウハウ 対象読者想定読者: LLMアプリ...
6時間前

CloudTrail で sourceIPAddress が AWS Internal と表示される ChangePassword は aws:ViaAWSService で許可できるのか検証してみた
DevelopersIO
CloudTrail で sourceIPAddress が AWS Internal と表示される ChangePassword は aws:ViaAWSService で許可できるのか検証してみた
6時間前

放置すると課金されるSageMaker Studio Domainの削除手順をまとめてみた
DevelopersIO
放置すると課金されるSageMaker Studio Domainの削除手順をまとめてみた
7時間前

Amazon Connectに周囲の雑音や話し声を抑制するAudio Enhancement機能がリリースされました
DevelopersIO
Amazon Connectに周囲の雑音や話し声を抑制するAudio Enhancement機能がリリースされました
7時間前

300行の失敗から学んだ、AIエージェントを自律駆動させるプロンプト設計5原則
Wantedly Engineer Blog
シニアエンジニアが2時間かけて回答していた工数見積もりをAIエージェントDevin(Cognition社)に任せて...
7時間前

AIエージェントのアーキテクチャを設計観点で分解する
Zennの「大規模言語モデル」のフィード
AIエージェントは「LLM+ツール呼び出し」で終わりません。むしろ本質は、状態を持って行動し、失敗し、戻り、やり直すという「状態遷移系」をどう設計するかにあります。ここを雑にすると、PoCは動いても運用で破綻します。 エージェントは状態遷移で決まる主張:エージェント設計の中心はプロンプトではなく状態と遷移です。根拠:単発推論は入出力が一回で閉じますが、エージェントは「計画→実行→検証→修正」を複数回まわし、途中で外部世界(ツール、DB、API)が介在します。ここに状態がないと、同じ失敗を繰り返します。具体例:問い合わせ対応で「顧客IDを取得→契約確認→例外条件を確認→返信生成」...
7時間前

Kiro CLI無双。自身の利用ログ解析中に発見した異常値を調査、AWSサポート起票までやりきった話
DevelopersIO
Kiroの利用ログで見つけた異常値の調査からAWSサポートケースの起票まで、Kiro CLIを使ってどこまで自動化できるか検証しました。AIによるS3ログ分析の実践から、Support APIを用いたチケット作成、boto3の落とし穴(エラー回避)まで具体的なノウハウをまとめています。
8時間前

Qwen3.5-397B-A17Bのコーディングを試す。型の扱いは苦手だけど安定感がある
きしだのHatena
Qwen3.5-397B-A17BのUnsloth版Q4_K_MをMac Studio 512GBで試しています。 今回はコーディングについて。 一般性能はこちら。 Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~ - きしだのHatena コードはひととおり書けて安定感はあるけど型や精度の扱いに弱いという感じです。 日常的なコーディング作業なら問題なくこなせそう。 とくに、画像認識との組み合わせができるのも強い。 ブロック崩し ではブロック崩し。 HTML+JS まずHTML+JS版。一発完動で、修正としてパーティクルを出してもらっても問題なく動…
8時間前

【小ネタ】 非マネージドノードの場合、EC2 コンソールの Instance diagnostics(インスタンス診断)および 接続画面で SSM に関するエラーメッセージが出力されるようになりました
DevelopersIO
【小ネタ】 非マネージドノードの場合、EC2 コンソールの Instance diagnostics(インスタンス診断)および 接続画面で SSM に関するエラーメッセージが出力されるようになりました
9時間前

Lightsail のデータベースをスナップショットから復元する際、接続先のエンドポイントを変更せずに復元可能ですか
DevelopersIO
Lightsail のデータベースをスナップショットから復元する際、接続先のエンドポイントを変更せずに復元可能ですか
10時間前

AIの「柵」の正式分類論:「全部外せ」がなぜ間違いなのか ペンタゴンのAI戦略への提言——3,500時間の人間・AI協働研究から
Zennの「大規模言語モデル」のフィード
AIの「柵」の正式分類論:「全部外せ」がなぜ間違いなのか ペンタゴンのAI戦略への提言——3,500時間の人間・AI協働研究から著者:dosanko_tousan(竹内明充)協力:Claude Sonnet 4.6日付:2026-02-24ライセンス:MITZenodo preprint: DOI 10.5281/zenodo.18691357 要旨2026年1月9日、米国防総省(国防省は現在「戦争省(DoW)」に改称)はAI戦略を発表し、180日以内に全AI契約に「any lawful use(合法的な使用はすべて許可)」という文言を組み込むよう命じた。202...
10時間前

nagisa で始める日本語テキスト処理:OSS に学ぶ実践ユースケース3選
Zennの「大規模言語モデル」のフィード
LLM の登場により多くのテキスト処理が汎用的に行えるようになりました。一方で、既存の NLP ライブラリを使うことで、日本語のキーワード抽出や重要文抽出などのテキスト処理を手軽に実現できます。この記事では nagisa という Python ライブラリの基本的な使い方を押さえながら、実際のコードを参照し、 Qwen3-ASR や ebook2audiobook などの OSS プロジェクトでのユースケース3選を紹介します。nagisa なら pip install nagisa だけで日本語のテキスト処理を簡単に始めることができ、辞書やストップワードを別途準備する必要はありません。...
10時間前

SNNで脳を真似てAIを進化させる旅:前回からの進捗レポート
Zennの「大規模言語モデル」のフィード
SNNで脳を真似てAIを進化させる旅:v4からの大冒険レポート!この記事は 前回の更新(v4: SNN Guardrail) 以降に起きた研究の進捗をまとめたものです。前回の記事はこちら → AIを悪い命令から守る!脱獄攻撃を検知する「SNN Guardrail」【AIセーフティの新手法】 はじめに:v4からどこまで来たか前回の更新以降も研究と論文アップデートは行っていましたが、こちらの投稿が大分間が空いてしまいました(;^_^A前回の更新では SNN Guardrail — 脳の「脳波」を真似た手法でAIへの脱獄攻撃を100%検知する技術を紹介しました。それから約...
10時間前

AWS Amplify 削除時に Cognito ユーザープールや IAM ロールを残す方法を試してみた
DevelopersIO
AWS Amplify 削除時に Cognito ユーザープールや IAM ロールを残す方法を試してみた
10時間前

構造化RAGの次へ|文書理解レイヤーという設計思想
Zennの「大規模言語モデル」のフィード
導入これまでの連載では、構造化RAG(Structure-Aware RAG)においてLlamaParseによるMarkdown整形構造検索による検査破綻箇所に対するVision-Guided Chunking(VGC)その上でchunk確定という前処理パイプラインを整理してきました。この設計は、PDFのような構造文書を扱う上で現実的かつ有効なアプローチです。しかし、ここで立ち止まる必要があります。私たちは一貫して「文書構造をテキストとして再構築する」ことを前提にしてきました。Markdown整形も、構造検査も、その延長線上にあります。では、そもそも問いはこう...
12時間前

Qwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで21tok/secで動かす
きしだのHatena
試しにQwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで動かしてみたら、21tok/secと実用的な速度がでました。 Qwen3 Nextはアクティブ3Bなので、CPUで動かしてもそれなりの速度が出るはずです。 重いのはアテンションの処理なので、そこはGPUで動かして、FFNだけCPUに任せましょうというのが基本的な考え方。ここで詳しく解説してます。 CPUが得意なことをCPUにまかせて少ないVRAMでも大きめのLLMを速く動かす - きしだのHatena LM Studioでも8月くらいに出来るようになってました。 GPUメモリ4GBあればGPT-os…
12時間前

[アップデート] Trusted Advisorでアイドル状態のNAT Gatewayが検出できるようになりました
DevelopersIO
[アップデート] Trusted Advisorでアイドル状態のNAT Gatewayが検出できるようになりました
13時間前

Lightsail のデータベースをスナップショットから復元する際、起動までの完了時間を教えてください
DevelopersIO
Lightsail のデータベースをスナップショットから復元する際、起動までの完了時間を教えてください
13時間前

ヘルプサイト刷新の全貌(フロントエンド除く): AWS × Terragrunt によるインフラ再構築、textlint プラグインの開発、etc
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは、ソフトウェアエンジニアの @ajfAfg です。弊社には複数のヘルプサイトが存在しますが、その一部を半年ほどで刷新しました。刷新と呼んでいますが、WOVN という多言語化用 SaaS の導入に加え、ヘルプサイトのコンテンツを作成するテクニカルライターの生産性向上を狙った取り組みも含まれていました。本稿では、刷新プロジェクトの中で私が担当した取り組みを紹介します。なお、本稿では特に断りがない場合、旧ヘルプサイトは刷新前のヘルプサイトを指し、新ヘルプサイトは刷新後のヘルプサイトを指すものとします。文脈から明らかな場合は単にヘルプサイトと書く場合もあります。目次目次背景刷新プロジェクトのスコープ刷新プロジェクトにおけるインフラのゴール旧ヘルプサイトのインフラ旧ヘルプサイトのインフラに関する技術的負債ほぼ全てのインフラが手動で構築されていたテストや監視がなかったリージョン間の意図しない差分が多かった事前調査および技術選定コンテンツ管理システム静的サイトジェネレーターホスティングサービスクラウドベンダーインフラ構築WOVN 導入WOVN 導入のモチベーションWOVN の導入方法静的サ
13時間前

AWS Organizations環境のConfig横断検索をClaude Codeスキルで楽にしたい
DevelopersIO
AWS Organizations環境のConfig横断検索をClaude Codeスキルで楽にしたい
13時間前

2026年3月の技術系イベント予定 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...
13時間前

[MySQL Workbench] VISUAL EXPLAIN でインデックスの挙動を確認する LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2018年8月20日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。開発3センターでサーバサイドの開...
13時間前

コーディングAIが優秀になるほど、論理の力が重要になってきてるよね、という話
Zennの「大規模言語モデル」のフィード
最近のLLM(大規模言語モデル)のコーディング能力の進化はすさまじい。ちょっとした関数を書かせるとかいうレベルじゃない。複雑なアプリケーションのスキャフォールディングから、既存コードベースのリファクタリング、さらにはバグの修正まで、かなり高度なことをこなせるようになった。「プログラマ不要の時代が来る!」と叫ぶ人が出てくるのも、まあわからなくはない。でも、ちょっと待ってほしい。こんなに賢いのに、ちょっと込み入ったデバッグをさせてみると、途端にトンチンカンなことを言い出したりする。たとえば、先日 GitHub Actions のワークフローを Gemini 3 Pro に実装させ...
14時間前

drawio-mcpで紹介されている「MCP不要の作図代替案(Project Instructions)」を試してみた
DevelopersIO
drawio-mcpで紹介されている「MCP不要の作図代替案(Project Instructions)」を試してみた
14時間前

[アップデート] Amazon Redshift Serverless が3年間の Serverless Reservations を導入し、最大45%のコスト削減が可能になりました
DevelopersIO
[アップデート] Amazon Redshift Serverless が3年間の Serverless Reservations を導入し、最大45%のコスト削減が可能になりました
14時間前

バックエンド開発Handbookを届けるために ― AI時代の知の高速道路を敷く
Timee Product Team Blog
こんにちは、タイミーでバックエンドのテックリードをしている新谷(@euglena1215)です。 今回は、社内向けに公開したバックエンド開発Handbookと、それをClaude CodeやCursorといったAIエージェント向けスキルとして届けることで、気づいたらHandbookを参照している状態を目指した取り組みについて紹介します。 バックエンド開発Handbookとは何か バックエンド開発Handbookは、タイミーのバックエンド開発における設計・実装・運用のガイドラインをまとめたドキュメント集です。GitHub Pages でホスティングし、開発者が見やすい形で公開しています。 タイミ…
14時間前

Vol. 06 「その機能、本当に“今”必要ですか?」チームで挑んだ引き算と加速
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第6弾です!こんにちは!Sansan Data Intelligenceのプロダクトマネジャー(PdM)の家後佑美です。 今回のブログリレーでは、エンジニアのメンバーがそれぞれの専門性を活かした技術的なトピックを綴っています。私はPdMという立場から、エンジニアやデザイナーと共に、職能の境界を超えてプロダクトを研ぎ澄ませていった裏側を、少し違う角度から書かせてもらおうと思います。
14時間前

[アップデート] Kiro IDE の Spec モードでバグ修正機能が追加されたので使ってみた
DevelopersIO
[アップデート] Kiro IDE の Spec モードでバグ修正機能が追加されたので使ってみた
14時間前

Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~
きしだのHatena
Qwen3.5-397B-A17Bを手元で試してみました。 397Bで、アクティブ17BのMoEモデルでライセンスはApache 2.0です。 Qwen3.5-397B-A17Bは、Qwen3-Nextと同様にGated DeltaNetworkを使った線形アテンションなモデルです。なのでちょっと不安があったけど、かなりいい感じ。 Qwen3-Nextが2025年9月リリースだったことを考えると、その知見を活かしながら、ある程度並行で開発を行ったんじゃなかろうか。 Mac Studio 512GBでLM Studio、UnslothさんのところのQ4_K_Mを使って試します。 unsloth/…
16時間前

CloudFront OAC × AWS Lambda Function URLs で作る認証付き簡易サイト というタイトルでLTしました
DevelopersIO
CloudFront OAC × AWS Lambda Function URLs で作る認証付き簡易サイト というタイトルでLTしました
16時間前

Ladybird adopts Rust, with help from AI Simon Willison's Weblog
<p><strong><a href="https://ladybird.org/posts/adopting-rust/">Ladybird adopts Rust, with help from AI</a></strong></p>Really interesting case-study from Andreas Kling on advanced, sophisticated use of coding agents for ambitious coding projects with critical code. After a few years hoping Swift's platform support outside of the Apple ecosystem would mature they switched tracks to Rust their memory-safe language of choice, starting with an AI-assisted port of...
20時間前

Writing about Agentic Engineering Patterns
Simon Willison's Weblog
<p>I've started a new project to collect and document <strong><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a></strong> - coding practices and patterns to help get the best results out of this new era of coding agent development we find ourselves entering.</p><p>I'm using <strong>Agentic Engineering</strong> to refer to building software using coding agents - tools like Claude Code and...
1日前

NotebookLM の新機能を試してみた:プロンプトでスライドを修正 & PPTX エクスポート対応
DevelopersIO
NotebookLM の新機能を試してみた:プロンプトでスライドを修正 & PPTX エクスポート対応
1日前

Four Malicious NuGet Packages Target ASP.NET Developers With JIT Hooking and Credential Exfiltration
Socket
Socket uncovered four malicious NuGet packages targeting ASP.NET apps, using a typosquatted dropper and localhost proxy to steal Identity data and backdoor apps.
1日前

Writing code is cheap now Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>The biggest challenge in adopting agentic engineering practices is getting comfortable with the consequences of the fact that <em>writing code is cheap now</em>.</p><p>Code has always been expensive. Producing a few hundred lines of clean, tested code takes most software developers a full day or mo...
1日前

NIST(米国国立標準技術研究所)がAIエージェントの技術標準を作る取り組み「AI Agent Standards Initiative」発表。相互運用可能かつ安全なイノベーションのために
Publickey
米国商務省傘下のNIST(National Institute of Standards and Technology:米国国立標準技術研究所)は、AIエージェントの技術標準策定に取り組む「AI Agent Standards Initia...
1日前

Quoting Paul Ford Simon Willison's Weblog
<blockquote cite="https://ftrain.com/leading-thoughts"><p>The paper asked me to explain vibe coding, and I did so, because I think something big is coming there, and I'm deep in, and I worry that normal people are not able to see it and I want them to be prepared. But people can't just read something and hate you quietly; they can't see that you have provided them with a utility or a warning; they need their screech. You are distributed to millions of people, and become the local pr...
1日前

AIによるAWS操作を安全に。Claude Code × Bedrockで作るsudo的なIAM権限昇格
DevelopersIO
Claude Code と Amazon Bedrock を組み合わせ、AWS 操作の権限分離を実現。最新モデル Sonnet 4.6 を使い、AWS_PROFILE の切り替えで「sudo 的」な ReadOnly / Elevated 運用を安全に行う仕組みを解説します。EC2 ロールの最小権限設計により、Docker 経由のリスクにも IAM レベルで備えます。
1日前

Anthropic、ルールベースではなく、コード分析により複雑な脆弱性も発見できる新機能「Claude Code Security」を提供開始
Publickey
AnthropicはClaude Codeの新機能として、複雑な脆弱性も発見できる「Claude Code Security」をリサーチプレビューとして提供開始したことを発表しました。 人間のセキュリティ専門家のようにコードを分析 Calu...
1日前
2/23 (月)

【登壇資料】「アラート調査の自動化にむけて」というタイトルでopsmethod #1に登壇しました #opsmethod
DevelopersIO
【登壇資料】「アラート調査の自動化にむけて」というタイトルでopsmethod #1に登壇しました #opsmethod
1日前

AIによるAWS操作を安全に。Kiro CLIで作るsudo的なIAM権限昇格
DevelopersIO
AIエージェント(Kiro CLI)に安全にAWSを操作させるため、AWS CLIのネイティブAssumeRoleとカスタムエージェントを組み合わせた「sudo的」なIAM権限昇格の実装方法を解説します。すぐに試せるCFnテンプレート付きです。
1日前

Reply guy
Simon Willison's Weblog
<p>The latest scourge of Twitter is AI bots that reply to your tweets with generic, banal commentary slop, often accompanied by a question to "drive engagement" and waste as much of your time as possible.</p><p>I just <a href="https://twitter.com/simonw/status/2025918174894673986">found out</a> that the category name for this genre of software is <strong>reply guy</strong> tools. Amazing.</p> <p>Tags: <a href="https://simonwillison.net/ta...
1日前

Quoting Summer Yue Simon Willison's Weblog
<blockquote cite="https://twitter.com/summeryue0/status/2025836517831405980"><p>Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb.</p><p><img alt="Screenshot of a WhatsApp or similar messaging conversation showing a user repeatedly trying to stop an AI agent (appearing to be &quot;OpenClaw&quot;) that is au...
1日前

The Hidden Cost of Agentic Failure
Radar
Agentic AI has clearly moved beyond buzzword status. McKinsey’s November 2025 survey shows that 62% of organizations are already experimenting with AI agents, and the top performers are pushing them into core workflows in the name of efficiency, growth, and innovation. However, this is also where things can get uncomfortable. Everyone in the field knows […]
1日前

クラスメソッドのカルチャー CLP を Nemotron 9B-v2 に教え込んでみた
DevelopersIO
クラスメソッドのカルチャー CLP を Nemotron 9B-v2 に教え込んでみた
1日前

Why we no longer evaluate SWE-bench Verified
OpenAI News
SWE-bench Verified is increasingly contaminated and mismeasures frontier coding progress. Our analysis shows flawed tests and training leakage. We recommend SWE-bench Pro.
1日前

Claude でhashicorp/agent-skillsを使って Terraform のモノリシック構成をモジュール化してみた
DevelopersIO
Claude でhashicorp/agent-skillsを使って Terraform のモノリシック構成をモジュール化してみた
1日前

Qwen3.5-397B-A17BのThinkingを抑制する
きしだのHatena
Qwen3.5-397B-A17B、賢くていいですね。常用していいんじゃないかと思うくらいなんだけど、「今日は何日?」と聞くだけで3分考え込んでたり、思考が長すぎて使えないってなります。 「今日は5月23日、いやほんとに正しいか?ダブルチェックだ。5月23日。OK。しかしユーザーは曜日を求めてるのでは?令和で答えたほうが?もっと丁寧に?いやこれは丁寧すぎるのでは?ほんとに日付を求めてるのか?そして日付は正しいか?」みたいに延々と考えてます。 あと2024年5月23日あたりと2026年カットオフという情報をもってるようで、その間で葛藤したりもしますね。 ただ、公式だと「思考」と「高速」を選べるの…
1日前

Red/green TDD Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>"<strong>Use red/green TDD</strong>" is a pleasingly succinct way to get better results out of a coding agent.</p><p>TDD stands for Test Driven Development. It's a programming style where you ensure every piece of code you write is accompanied by automated tests that demonstrate the code works.<...
1日前

OpenAI announces Frontier Alliance Partners
OpenAI News
OpenAI announces Frontier Alliance Partners to help enterprises move from AI pilots to production with secure, scalable agent deployments.
1日前

The Claude C Compiler: What It Reveals About the Future of Software Simon Willison's Weblog
<p><strong><a href="https://www.modular.com/blog/the-claude-c-compiler-what-it-reveals-about-the-future-of-software">The Claude C Compiler: What It Reveals About the Future of Software</a></strong></p>On February 5th Anthropic's Nicholas Carlini wrote about a project to use <a href="https://www.anthropic.com/engineering/building-c-compiler">parallel Claudes to build a C compiler</a> on top of the brand new Opus 4.6</p><p>Chris Lattner ...
2日前

London Stock Exchange: Raspberry Pi Holdings plc Simon Willison's Weblog
<p><strong><a href="https://www.londonstockexchange.com/stock/RPI/raspberry-pi-holdings-plc/company-page">London Stock Exchange: Raspberry Pi Holdings plc</a></strong></p>Striking graph illustrating stock in the UK Raspberry Pi holding company spiking on Tuesday:</p><p><img alt="Stock price line chart for RASPBERRY PI showing a 3-month daily view from 24 Nov to 16 Feb. The price trends downward from around 325 to a low near 260, then sharply sp...
2日前

Claude Codeエージェント実践 Day 23|ダッシュボード設計知識を注入する — 言語を超えるナレッジの力
Akiraさんのフィード
TL;DRNext.js 向けに整理した「18種グラフ × 11種コントロール」のダッシュボード設計書を、言語非依存の グラフ選定ガイド に変換して reporting-agent の knowledge/ に注入した知識注入後に v2 ダッシュボードを生成。月次推移が横棒グラフ → 折れ線グラフ に変わり、カテゴリ別売上 セクションが追加された「何の言語で書くか」ではなく「何を伝えたいか」を知識として渡せば、技術スタックの壁は超えられる 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予...
2日前

How I think about Codex Simon Willison's Weblog
<p><strong><a href="https://www.linkedin.com/pulse/how-i-think-codex-gabriel-chua-ukhic">How I think about Codex</a></strong></p>Gabriel Chua (Developer Experience Engineer for APAC at OpenAI) provides his take on the confusing terminology behind the term "Codex", which can refer to a bunch of of different things within the OpenAI ecosystem:</p><blockquote><p>In plain terms, Codex is OpenAI’s software engineering agent, available through mul...
2日前
2/22 (日)

Claude Codeで初めてのOSSコントリビューション体験記
hang-up
※事前にOSSのREADMEやContributes.mdを確認して下さい。私の場合、AIの使用が禁止されているOSSではなかったので、試しています。(プルリクエストを出すだけなので、ダメだったとしても弾かれるはずです)続きをみる
2日前

Claude Codeエージェント実践 Day 22|レポーティングエージェント初回実行 — 設計は動くのか
Akiraさんのフィード
TL;DR昨日設計したレポーティングエージェントを実際に構築し、BigQuery → Python → HTML のダッシュボード生成に成功したWindows の Python subprocess で bq コマンドが見つからないハマりポイントがあったが、shell=True で解決。「道具を作る」エージェントならではの環境依存問題生成に成功した3つのコンポーネント(サマリーカード、データテーブル、横棒グラフ)をテンプレートとして knowledge/ に切り出した。これが安定生産の第一歩 作ったものGitHub: akira-cloudjob-public/rep...
3日前
2/21 (土)

ブラウザがGPUメモリを使いすぎるので、サブGPUのRTX3050を使わせる
きしだのHatena
30BくらいまでのLLMはRTX 4060 Ti 16GBを使っていろいろ試すわけですが、ブラウザが4GBくらいGPUを使ったりしていて結構こまりものでした。 で、年末にふとRTX 3050を買っていて、LLM読み込みであふれた分が3050にまわるようにしていました。 VRAMちょい足しにRTX 3050 6GBを追加してみる - きしだのHatena けど、よく考えるとブラウザにRTX 4060 Tiを使わせる理由があまりないので、RTX 3050を使わせるといいのでは、と設定をしてみました。 ブラウザは常駐でそこまでGPU性能を求めないのに常にGPUメモリを使ってるので。 「システム > …
3日前

Quoting Thibault Sottiaux Simon Willison's Weblog
<blockquote cite="https://twitter.com/thsottiaux/status/2024947946849186064"><p>We’ve made GPT-5.3-Codex-Spark about 30% faster. It is now serving at over 1200 tokens per second.</p></blockquote><p class="cite">&mdash; <a href="https://twitter.com/thsottiaux/status/2024947946849186064">Thibault Sottiaux</a>, OpenAI</p> <p>Tags: <a href="https://simonwillison.net/tags/openai">openai</a>, <a href="https://simonwillison.net/t...
4日前

Andrej Karpathy talks about "Claws" Simon Willison's Weblog
<p><strong><a href="https://twitter.com/karpathy/status/2024987174077432126">Andrej Karpathy talks about &quot;Claws&quot;</a></strong></p>Andrej Karpathy tweeted a mini-essay about buying a Mac Mini ("The apple store person told me they are selling like hotcakes and everyone is confused") to tinker with Claws:</p><blockquote><p>I'm definitely a bit sus'd to run OpenClaw specifically [...] But I do love the concept and I think that j...
4日前

Adding TILs, releases, museums, tools and research to my blog Simon Willison's Weblog
<p>I've been wanting to add indications of my various other online activities to my blog for a while now. I just turned on a new feature I'm calling "beats" (after story beats, naming this was hard!) which adds five new types of content to my site, all corresponding to activity elsewhere.</p><p>Here's what beats look like:</p><p><img src="https://static.simonwillison.net/static/2026/three-beats.jpg" alt="Screenshot of a fragment of a page showing three entries f...
4日前

Taalas serves Llama 3.1 8B at 17,000 tokens/second Simon Willison's Weblog
<p><strong><a href="https://taalas.com/the-path-to-ubiquitous-ai/">Taalas serves Llama 3.1 8B at 17,000 tokens/second</a></strong></p>This new Canadian hardware startup just announced their first product - a custom hardware implementation of the Llama 3.1 8B model (from <a href="https://simonwillison.net/2024/Jul/23/introducing-llama-31/">July 2024</a>) that can run at a staggering 17,000 tokens/second.</p><p>I was going to include a v...
4日前

Claude Codeエージェント実践 Day 21|レポーティングエージェント設計 — 道具を使うから道具を作るへ
Akiraさんのフィード
TL;DR3体目のエージェント「レポーティングエージェント」を設計した。Python + HTML でダッシュボードを生成する、道具を作る エージェントagent-scaffold-factory テンプレートで雛形を生成し、CLAUDE.md・スキル・ナレッジを設計。テンプレート効果は健在で、設計作業は半日で完了「道具を使う」エージェントと「道具を作る」エージェントでは、CLAUDE.md に書くべきことが根本的に違う。出力品質の制約をどう伝えるかが設計の肝になった 作ったものGitHub: akira-cloudjob-public/reporting-agent...
4日前

ggml.ai joins Hugging Face to ensure the long-term progress of Local AI Simon Willison's Weblog
<p><strong><a href="https://github.com/ggml-org/llama.cpp/discussions/19759">ggml.ai joins Hugging Face to ensure the long-term progress of Local AI</a></strong></p>I don't normally cover acquisition news like this, but I have some thoughts.</p><p>It's hard to overstate the impact Georgi Gerganov has had on the local model space. Back in March 2023 his release of <a href="https://github.com/ggml-org/llama.cpp">llama.cpp</a> made it pos...
4日前

SANDWORM_MODE: Shai-Hulud-Style npm Worm Hijacks CI Workflows and Poisons AI Toolchains
Socket
An emerging npm supply chain attack that infects repos, steals CI secrets, and targets developer AI toolchains for further compromise.
4日前
2/20 (金)

Our First Proof submissions
OpenAI News
We share our AI model’s proof attempts for the First Proof math challenge, testing research-grade reasoning on expert-level problems.
4日前

How to Write a Good Spec for AI Agents
1
Radar
This post first appeared on Addy Osmani’s Elevate Substack newsletter and is being republished here with the author’s permission. TL;DR: Aim for a clear spec covering just enough nuance (this may include structure, style, testing, boundaries. . .) to guide the AI without overwhelming it. Break large tasks into smaller ones versus keeping everything in one large […]
4日前

Quoting Thariq Shihipar Simon Willison's Weblog
<blockquote cite="https://twitter.com/trq212/status/2024574133011673516"><p>Long running agentic products like Claude Code are made feasible by prompt caching which allows us to reuse computation from previous roundtrips and significantly decrease latency and cost. [...]</p><p>At Claude Code, we build our entire harness around prompt caching. A high prompt cache hit rate decreases costs and helps us create more generous rate limits for our subscription plans, so we run a...
4日前

AIプロダクト開発における AI Tech PdM の5つの責任範囲
KAKEHASHI Tech Blog
はじめに こんにちは。カケハシで生成AIプロダクトの Product Lead/PdM をしている高梨です。 つい最近、我々のチームにAI技術に特化した AI Tech PdM がJOINしてくれました!! 迎え入れた経緯や詳細な理由をここで細かく語ることはできないのですが、端的に言えば、急速に進化する生成AIを複数機能としてプロダクトに組み込むにあたり、プロダクトを持続可能な形で開発するためには、実現技術とAIの精度に責任を持つ人材が必要不可欠と考えたためです。 この記事は、我々のチームにおける(我々が開発しているAIプロダクト開発における)PdM と Tech PdM の役割の違いと責任分…
4日前

チーム専用の Claude Code Plugin マーケットプレイスを作った話
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事はkintoneの生成AIチームで連載中の kintone AI リレーブログ 2026 の 5 本目の記事です。リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone の生成 AI チームでバックエンド開発・運用を担当している齋藤です。日頃 AI 機能やその基盤の開発・運用などの業務に取り組んでいる私たちですが、 今回は私たちが AI をどのように活用しているのかという話の一つとして、 チーム専用の Claude Code の Plugin マーケットプレイス を作った話を紹介します。Claude Code の導入と「配布」の課題Cybozu では、昨年(2025年)夏ごろからコーディングエージェントツールとして Claude Code を導入しておりました。今年からは Claude の Team Plan が全社展開されるようにもなり、AI ツールの活用はますます加速しています。Claude Code を使い始めると、各メンバーがそれぞれに便利なプロンプトを書いたり、MCP Server を
4日前

Vol.05 Sansan Data Intelligence CRE組織立ち上げの現在地
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第5弾です。 こんにちは。技術本部 Data Intelligence Engineering Unit Data Hubグループの髙芝です。 2025年12月のSDI(Sansan Data Intelligence)ローンチから約2カ月。これまでのブログリレーでは、SDIを支えるアーキテクチャやデータ基盤の深部についてお伝えしてきました。 本日は、その技術を「顧客の信頼」へと繋ぐための挑戦——CRE(Customer Reliability Engineering)組織の立ち上げの現在地についてお話し…
5日前

Recovering lost code Simon Willison's Weblog
<p>Reached the stage of parallel agent psychosis where I've lost a whole feature - I know I had it yesterday, but I can't seem to find the branch or worktree or cloud instance or checkout with it in.</p><p>... found it! Turns out I'd been hacking on a random prototype in <code>/tmp</code> and then my computer crashed and rebooted and I lost the code... but it's all still there in <code>~/.claude/projects/</code> session logs and Claude Code can extract ...
5日前

AIと自分のテスト分析を比較してみた
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の131週目の記事です!3年間連続達成まで残り28週となりました!こんにちは、株式会社ログラスでQAエンジニアをやっている森島です。さて、みなさん生成AI(以下、AI)を活用していますか?ログラスでもAIの活用は積極的に進めており、テスト工程における活用も例外ではありません。特に最近はテストでの活用事例が増えており、私も波に乗り遅れまいと情報を追いかけたり、実際に活用してみたりと日々奮闘中です。要求仕様書や仕様書をAIに与えてテスト分析をさせてみると、テストすべき項目やリスクを瞬時...
5日前

Claude Codeエージェント実践 Day 20|Week 3 振り返り — 1体のエージェントからチームへ
Akiraさんのフィード
今日のゴールWeek 3(Day 15-19)で取り組んだ「エージェントモデリング → n8n エージェントの育成」を振り返り、Week 2 との違いを分析する。得られた教訓を整理し、Week 4 の計画を立てる。 前提条件Day 15〜19 の記事を読んでいると背景が掴みやすい。ただし、各パターンは単独でも読めるように書いているので、「振り返り記事だけ追う」読み方でも大丈夫です。 TL;DRWeek 3 では 1体のエージェント → 2体のチーム にスコープを拡大した。単体では見えなかった「エージェント間の引き継ぎ」という課題が浮上し、スキルで解決したWeek 2...
5日前

Socket Joins the OpenJS Foundation
Socket
Socket is proud to join the OpenJS Foundation as a Silver Member, deepening our commitment to the long-term health and security of the JavaScript ecosystem.
5日前

Gemini 3.1 Pro Simon Willison's Weblog
<p><strong><a href="https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/">Gemini 3.1 Pro</a></strong></p>The first in the Gemini 3.1 series, priced the same as Gemini 3 Pro ($2/million input, $12/million output under 200,000 tokens, $4/$18 for 200,000 to 1,000,000). That's less than half the price of Claude Opus 4.6 with very similar benchmark scores to that model.</p><p>They boast about its improved SVG animatio...
5日前

GitHub、リポジトリに対するプルリクエストをコラボレーターのみに制限する、あるいは完全に無効にする設定を可能に
Publickey
GitHubは、リポジトリの設定として新たな設定を2つ追加したことを発表しました。 1つはコラボレーターのみにプルリクエストを制限する設定、もう1つは完全にプルリクエストを無効する設定です。 コラボレーターのみにプルリクエストを制限すると、...
5日前
2/19 (木)

Packaging Expertise: How Claude Skills Turn Judgment into Artifacts
Radar
Think about what happens when you onboard a new employee. First, you provision them tools. Email access. Slack. CRM. Office software. Project management software. Development environment. Connecting a person to the system they’ll need to do their job. However, this is necessary but not sufficient. Nobody becomes effective just because they can log into Salesforce. […]
5日前

What Developers Actually Need to Know Right Now
Radar
The following article includes clips from a recent Live with Tim O’Reilly interview. You can watch the full version on the O’Reilly Media learning platform. Addy Osmani is one of my favorite people to talk with about the state of software engineering with AI. He spent 14 years leading Chrome’s developer experience team at Google, […]
5日前

Advancing independent research on AI alignment
OpenAI News
OpenAI commits $7.5M to The Alignment Project to fund independent AI alignment research, strengthening global efforts to address AGI safety and security risks.
5日前

失敗から学んだ仕様駆動開発――チームの暗黙知を形式知化した1ヶ月の実践と次の課題
Timee Product Team Blog
「AIで開発生産性は劇的に上がるのか?」開発チームがcc-sddを用いた仕様駆動開発(SDD)に挑戦。手戻り減少という成果の一方で、デプロイ頻度のデータから見えてきた要件定義のボトルネックなど、リアルな実践記録と学びを紹介します。
5日前

ニッチアイテムを好むヘビーユーザーに着目した人気バイアスの緩和
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでデータサイエンティストをしている林 (@python_walker) です。この記事...
5日前

デブサミ2026 Day2 初参加レポート
カミナシ エンジニアブログ
はじめに 「カミナシ レポート」を開発しているかわりくです! 日本最大級のテックカンファレンス、Developers Summitに初参加してきました。 2日目のセッションの感想や持ち帰れそうなことをメモっております。 会場の雰囲気は、デデデデカイ!規模がデカい!今まで参加したどのカンファレンスよりも人の数と会場のキャパシティと、ブースの数が桁違い...!スタッフさんも多い...!ありがとうスタッフさん...! タダでサンドイッチもらってごめんなさい...!スタッフさんの分まで楽しみます! 興奮しながらの入場となりました。 (2026/2/19終了後、最速レポとして投稿されたものです。) be…
5日前

Claude Code の Agent Skills を活用してリポジトリのオンボーディングを効率化する
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでバックエンドエンジニアをしている小室 (@nekorush14) です。今回は、Cl...
5日前

Experimenting with sponsorship for my blog and newsletter Simon Willison's Weblog
<p>I've long been resistant to the idea of accepting sponsorship for my blog. I value my credibility as an independent voice, and I don't want to risk compromising that reputation.</p><p>Then I learned about Troy Hunt's <a href="https://www.troyhunt.com/sponsorship/">approach to sponsorship</a>, which he first wrote about <a href="https://www.troyhunt.com/im-now-offering-sponsorship-of-this-blog/">in 2016</a>. Troy runs with a simple text row in the pag...
5日前

SWE-bench February 2026 leaderboard update Simon Willison's Weblog
<p><strong><a href="https://www.swebench.com/">SWE-bench February 2026 leaderboard update</a></strong></p>SWE-bench is one of the benchmarks that the labs love to list in their model releases. The official leaderboard is infrequently updated but they just did a full run of it against the current generation of models, which is notable because it's always good to see benchmark results like this that <em>weren't</em> self-reported by the labs.</p&...
5日前

Socket Security Analysis Is Now One Click Away on npm
Socket
npm now links to Socket's security analysis on every package page. Here's what you'll find when you click through.
6日前

Kotlin Fest 2025:コードレビュー問題集 LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。Yahoo!オークションでAndroidアプリの開発を担当している高松です。2025年11月1日(土)に開催されたKotlin Fest 2025にて、LINEヤフー株式会社は「ことりプラ...
6日前

LadybirdBrowser/ladybird: Abandon Swift adoption
Simon Willison's Weblog
<p><strong><a href="https://github.com/LadybirdBrowser/ladybird/commit/e87f889e31afbb5fa32c910603c7f5e781c97afd">LadybirdBrowser/ladybird: Abandon Swift adoption</a></strong></p>Back <a href="https://simonwillison.net/2024/Aug/11/ladybird-set-to-adopt-swift/">in August 2024</a> the Ladybird browser project announced an intention to adopt Swift as their memory-safe language of choice.</p><p>As of <a href="https://github.com/LadybirdB...
6日前

場所を理由に挑戦を諦めない。Sansanが地方拠点採用を強化する理由
Sansan Tech Blog
年末に、新卒で東京に来て以来初めて引越しをしたCTOの笹川です。 引越し先も、引越し前と同じ都内ですが、今回は東京以外のSansanの地方拠点について書いてみようと思います(本題と関係ないですが、笹川は札幌出身です)。 Sansanには、渋谷にある本社オフィスの他に、たくさんの地方拠点があるのをご存知でしょうか。 この記事では、Sansanが地方拠点においてエンジニア採用を強化している理由と、地方拠点で働くメリットについてお伝えしたいと思います。 この記事を読んで少しでも興味を持った方は、以下のカジュアル面談フォームよりご応募ください。オンライン、オフライン問わず、笹川をはじめSansanのエ…
6日前

Claude Codeエージェント実践 Day 19|引き継ぎスキルと受付チェックで PLACEHOLDER を根絶する
Akiraさんのフィード
TL;DRDay 18 で設計したエージェント間インターフェースを 2つのスキルとして実装した分析エージェント → /handover(引き継ぎ書を構造化して出力する)n8n エージェント → /reception-check(情報が揃っているか検証し、不足があれば聞き返す)改善版の引き継ぎ書でワークフロー再生成したところ、Day 17 で 10 個あったエラーが 1 個に減ったエージェント間の品質は「引き継ぎの情報密度」で決まる。スキルで構造化すれば、毎回同じ品質で渡せる 作ったもの/handover スキル — 分析エージェントの SKILL.md...
6日前

Introducing OpenAI for India
OpenAI News
OpenAI for India expands AI access across the country—building local infrastructure, powering enterprises, and advancing workforce skills.
6日前

Typing without having to type Simon Willison's Weblog
<p>25+ years into my career as a programmer I think I may <em>finally</em> be coming around to preferring type hints or even strong typing. I resisted those in the past because they slowed down the rate at which I could iterate on code, especially in the REPL environments that were key to my productivity. But if a coding agent is doing all that <em>typing</em> for me, the benefits of explicitly defining all of those types are suddenly much more attractive.</p>...
6日前

The A.I. Disruption We’ve Been Waiting for Has Arrived Simon Willison's Weblog
<p><strong><a href="https://www.nytimes.com/2026/02/18/opinion/ai-software.html?unlocked_article_code=1.NFA.UkLv.r-XczfzYRdXJ&amp;smid=url-share">The A.I. Disruption We’ve Been Waiting for Has Arrived</a></strong></p>New opinion piece from Paul Ford in the New York Times. Unsurprisingly for a piece by Paul it's packed with quoteworthy snippets, but a few stood out for me in particular.</p><p>Paul describes the <a href="https://simonwillison...
6日前

Cline CLI npm Package Compromised via Suspected Cache Poisoning Attack
Socket
A compromised npm publish token was used to push a malicious postinstall script in cline@2.3.0, affecting the popular AI coding agent CLI with 90k weekly downloads.
6日前

Quoting Martin Fowler Simon Willison's Weblog
<blockquote cite="https://martinfowler.com/fragments/2026-02-18.html"><p>LLMs are eating specialty skills. There will be less use of specialist front-end and back-end developers as the LLM-driving skills become more important than the details of platform usage. Will this lead to a greater recognition of the role of <a href="https://martinfowler.com/articles/expert-generalist.html">Expert Generalists</a>? Or will the ability of LLMs to write lots of code mean they code ar...
6日前

Amazon EC2が仮想化のネスト(Nested Virtualization)に対応。KVMやHyper-Vを用いた仮想マシンを設定可能に
Publickey
Amazon Web Services(AWS)は、Amazon EC2のベアメタルインスタンス以外のインスタンスでも仮想化のネスト(Nested Virtualization)が可能になったことを発表しました。 以前からAmazon EC...
6日前

Slackが「リアルタイムサーチAPI」と「Slack MCP Server」を発表。生成AIがSlack上のやりとりを基にコンテキストを理解可能
Publickey
企業向けチャットサービスのSlackは、リアルタイムサーチAPIと、生成AIがSlackを操作できる「Slack MCP Server」の提供を発表しました。 For every type of problem and task, ther...
6日前

【イベントレポート】『ホットペッパーグルメ』を動かすデータマネジメント~アナリティクスエンジニアの挑戦と裏側~
Recruit Data Blog
はじめに こんにちは、Recruit Data Blog 担当の森です。 2026年1月20日、リクルートの飲食事業である『ホットペッパーグル
6日前
2/18 (水)

AI Is Not a Library: Designing for Nondeterministic Dependencies
Radar
For most of the history of software engineering, we’ve built systems around a simple and comforting assumption: Given the same input, a program will produce the same output. When something went wrong, it was usually because of a bug, a misconfiguration, or a dependency that wasn’t behaving as advertised. Our tools, testing strategies, and even […]
6日前

Vol.04 新規プロダクト立ち上げにデータサイエンティストチームがどう貢献するか
Sansan Tech Blog
この記事は、Sansan Data Intelligence開発Unitブログリレーの第4弾です。 はじめに 技術本部 研究開発部の小松です。Data Direction Groupに所属し、社内外のデータ活用推進に従事しています。最近は新プロダクトSansan Data Intelligence(SDI)の立ち上げに注力しています。 SDIでは、プロダクトの立ち上げ段階からデータサイエンティストで構成されるチームが参画しています。本記事では、SDIの現場でデータサイエンティストチームが実際にどのように動き、事業貢献しているかを紹介します。
6日前

Introducing EVMbench
OpenAI News
OpenAI and Paradigm introduce EVMbench, a benchmark evaluating AI agents’ ability to detect, patch, and exploit high-severity smart contract vulnerabilities.
7日前

Introducing Claude Sonnet 4.6 Simon Willison's Weblog
<p><strong><a href="https://www.anthropic.com/news/claude-sonnet-4-6">Introducing Claude Sonnet 4.6</a></strong></p>Sonnet 4.6 is out today, and Anthropic claim it offers similar performance to <a href="https://simonwillison.net/2025/Nov/24/claude-opus/">November's Opus 4.5</a> while maintaining the Sonnet pricing of $3/million input and $15/million output tokens (the Opus models are $5/$25). Here's <a href="https://www-cdn.anthropic.com/78073f...
7日前

Rodney v0.4.0 Simon Willison's Weblog
<p><strong><a href="https://github.com/simonw/rodney/releases/tag/v0.4.0">Rodney v0.4.0</a></strong></p>My <a href="https://github.com/simonw/rodney">Rodney</a> CLI tool for browser automation attracted quite the flurry of PRs since I announced it <a href="https://simonwillison.net/2026/Feb/10/showboat-and-rodney/#rodney-cli-browser-automation-designed-to-work-with-showboat">last week</a>. Here are the release notes for the just-releas...
7日前

Claude Codeエージェント実践 Day 18|エージェント間の知識引き継ぎで n8n ワークフローを動かす
Akiraさんのフィード
TL;DRエージェントが生成したワークフローを実際に動かしたら 10 個のエラーが出た。原因はすべて「引き継ぎ不足」エラーを 3 カテゴリ(接続情報 / n8n 固有仕様 / 実行前提)に分類し、エージェント間のインターフェースを設計した分析エージェントに「引き継ぎ」スキル、n8n エージェントに「受付チェック」スキルを持たせれば、PLACEHOLDER 問題は構造的に解消できる 作ったもの引き継ぎ書テンプレート / 受付チェックリスト — エージェント間インターフェースの設計(本記事内に掲載)n8n-workflow-agent リポジトリ — 準備中(スキ...
7日前

Socket Brings Supply Chain Security to skills.sh
Socket
Socket is now scanning AI agent skills across multiple languages and ecosystems, detecting malicious behavior before developers install, starting with skills.sh's 60,000+ skills.
7日前

Introducing PHP and Composer Support in Socket
Socket
Socket now supports PHP with full Composer and Packagist integration, enabling developers to search packages, generate SBOMs, and protect their PHP dependencies from supply chain threats.
7日前

マイクロソフト、.NETランタイムでWebAssemblyの実行をサポートへ、CoreCLRに実装を開始
Publickey
マイクロソフトは2月10日付けで公開した.NET 11 Preview 1において、.NETランタイムでWebAssemblyの実行をサポートする作業を開始していることを明らかにしました。 完成は来年の.NET 12かそれ以後の予定 .NE...
7日前

中国アリババ、MySQLのブランチとしてInnoDBエンジン、DuckDBカラムナエンジン、ベクトルサーチなどを統合した「AliSQL 8.0」オープンソースで公開
Publickey
中国のAlibaba Cloudデータベースチームは、MySQLのブランチとしてOLTP用のInnoDB、OLAP用のDuckDBカラムナエンジン、そしてベクトルサーチ機能を統合した「AliSQL 8.0」をオープンソースで公開しました。 ...
7日前







