直近1週間の更新
2/21 (土)

Entra ID と AWS IAM Identity Center を連携している環境において SAML 証明書を更新してみた
DevelopersIO
Entra ID と AWS IAM Identity Center を連携している環境において SAML 証明書を更新してみた
1時間前

Nemotron 9B-v2-Japanese を SageMaker 東京リージョンに VPC 閉域構成でデプロイしてみた
DevelopersIO
Nemotron 9B-v2-Japanese を SageMaker 東京リージョンに VPC 閉域構成でデプロイしてみた
4時間前

Obsidian Web Clipper × Claude Codeで技術記事の自動整理をしてみた
DevelopersIO
Obsidian Web Clipper × Claude Codeで技術記事の自動整理をしてみた
5時間前

AI: The Best Supporting Actor You’ll Never See
PYMNTS.com
Every Oscars season, Hollywood celebrates “human artistry” while quietly adopting whatever tech makes the deadline less terrifying. This year, artificial intelligence (AI) is the newest crew member: it doesn’t need a trailer, and it definitely won’t complain about craft-services hummus. The only catch? Nobody wants it walking the red carpet. The Academy’s Neutrality Is […]The post AI: The Best Supporting Actor You’ll Never See appeared first on PYMNTS.com.
6時間前

ブラウザがGPUメモリを使いすぎるので、サブGPUのRTX3050を使わせる
1
きしだのHatena
30BくらいまでのLLMはRTX 4060 Ti 16GBを使っていろいろ試すわけですが、ブラウザが4GBくらいGPUを使ったりしていて結構こまりものでした。 で、年末にふとRTX 3050を買っていて、LLM読み込みであふれた分が3050にまわるようにしていました。 VRAMちょい足しにRTX 3050 6GBを追加してみる - きしだのHatena けど、よく考えるとブラウザにRTX 4060 Tiを使わせる理由があまりないので、RTX 3050を使わせるといいのでは、と設定をしてみました。 ブラウザは常駐でそこまでGPU性能を求めないのに常にGPUメモリを使ってるので。 「システム > …
6時間前

メンバーズ CUR でやってみよう!SP の各種情報(インベントリ、使用率、カバー率、按分)を Slack へレポート通知する編
DevelopersIO
メンバーズ CUR でやってみよう!SP の各種情報(インベントリ、使用率、カバー率、按分)を Slack へレポート通知する編
6時間前

Graviton4 は 1 vCPU だと Graviton3 より遅い? STREAM ベンチマークでメモリ帯域幅を調べていたときの話
DevelopersIO
Graviton4 は 1 vCPU だと Graviton3 より遅い? STREAM ベンチマークでメモリ帯域幅を調べていたときの話
6時間前

k6 で複数シナリオを同時実行し、Grafana OSS でダッシュボードを分けて可視化してみた
DevelopersIO
k6 で複数シナリオを同時実行し、Grafana OSS でダッシュボードを分けて可視化してみた
6時間前

Cortex Analyst の Cortex Search 統合によるリテラル検索の改善を試してみた #SnowflakeDB
DevelopersIO
Cortex Analyst の Cortex Search 統合によるリテラル検索の改善を試してみた #SnowflakeDB
7時間前

【革命】コンテキスト長の限界を100倍突破!「Recursive Language Models」が2026年のAI開発を変える
LLMタグが付けられた新着記事 - Qiita
結論から言うと、AIが自分自身を再帰的に呼び出して超長文を処理する「Recursive Language Models(RLM)」が登場し、コンテキスト長の限界を100倍突破しました。これは2026年のパラダイムシフトです。あなたのAIエージェント、すぐに「忘れる」問題...
7時間前

プロンプトを「コード」として管理・テストする実務プラクティス
LLMタグが付けられた新着記事 - Qiita
スプレッドシートでのプロンプト管理は確実に破綻する生成AIを組み込んだシステムの開発において、プロンプトの管理方法をどう設計するかは、プロジェクトの成否を分ける重要な分岐点です。初期のPoC段階では、プランナーやドメインエキスパートが手軽に編集できるよう、スプレッドシー...
7時間前

Azure Functions の自動スケールが引き起こす Rate Limit Error とその対策
Zennの「大規模言語モデル」のフィード
1. はじめにRAGシステムの検索用データを生成するために、大量のPDFをGPTモデルでマークダウンに変換するパイプラインを構築した。しかし、Azure Functions の自動スケールによりGPTへのリクエストが集中し、Rate Limit Error が頻発した。本記事では、Durable Functions を使って処理の並列度を制御し、Rate Limit Error を回避した方法を紹介する。 2. 構築したデータパイプライン以下のパイプラインでPDFからマークダウンを生成していた。処理の流れBlob Storage にPDFファイルをアップロードEve...
8時間前

簡易的なアイデア生成アプリを作ってみた
LLMタグが付けられた新着記事 - Qiita
初めにプログラミングで何を作りたいのか分からなくなるときがあるので、アイデアを出してくれるアプリをLLMとNode.jsで作ってみました。準備まず、以下のコマンドを使用して、package.jsonを生成します:bashnpm init -y次に、以下...
8時間前

AntigravityでLangGraphを使った「自立型ディベートエージェント」を作ってみた
Zennの「大規模言語モデル」のフィード
アプリの概要ユーザーが設定した議題に対して、「肯定側」と「否定側」のAIエージェントが自律的にディベートを行い、指定されたターン数で議論をし、最後に「審判」エージェントが勝敗とその判断理由を下すWebアプリケーションです。ハルシネーションをさせないために議論の元となるデータはTavily Search APIを使用して、web検索させるようにしています。UI側はStreamlit で作り、ユーザーが議題とターン数を入力できるようにし、「肯定側」と「否定側」、「審判」エージェントの出力結果を確認できるようにしてます。▼ アプリUI画面(一部抜粋)▼ 処理フローのイメージ...
9時間前

人工知能概論【第十一講】
LLMタグが付けられた新着記事 - Qiita
Lecture 11: Introduction to Large Language Models (LLM)LLMの学習フェーズと「オープン・クローズド」モデルの違い← 人工知能概論:まとめページに戻る前回の振り返りと今回のテーマ前回の第10講では、自然言...
9時間前

AIの根性論を叩き直す — 「忘れた」「気づかなかった」への工学的処方箋
Zennの「大規模言語モデル」のフィード
先日、Skillはバッチではない — AI Skill運用で気づいた設計原則という記事を公開した。あの記事には5つの原則が整理されている。特に原則①「作業開始時に手順をリスト化する」と原則②「作業終了時に必ずレビューさせる」——この2つには、書かなかった裏話がある。この記事では、あの原則に至るまでに何が起きていたかを書く。 Skillは作った直後、ちゃんと動くSkillを書いて、実行する。最初の数回は、うまく動く。期待通りの出力が返ってくる。「よし、これでいける」と思う。しかし何回か繰り返すと、突然、失敗する。手順の一部が飛ばされたり、確認すべき項目が漏れたりする。ここから...
12時間前

書評:LLMの原理、RAG・エージェント開発から読み解く コンテキストエンジニアリング
1
Zennの「大規模言語モデル」のフィード
この度、『LLMの原理、RAG・エージェント開発から読み解く コンテキストエンジニアリング』を著者の蒲生さんからご恵贈いただきました。一通り読み終えたので、ここに書評という形で感想をまとめます。https://x.com/07JP27/status/2017569051812499567?s=20購入はこちらからhttps://amzn.asia/d/hGHNzNy 総評『何を・どう詰め込み、何を詰め込まないかを設計するのがコンテキストエンジニアリング』本書を読んで、その輪郭が最も明確になったのがこの一文でした。本書は全体を通して以下のような点で優れています。 Poi...
12時間前

Amazon Quick Sight で「データセットの変更が多すぎます」エラーでビジュアルが壊れたときの対処法
DevelopersIO
Amazon Quick Sight で「データセットの変更が多すぎます」エラーでビジュアルが壊れたときの対処法
13時間前

Quoting Thibault Sottiaux Simon Willison's Weblog
<blockquote cite="https://twitter.com/thsottiaux/status/2024947946849186064"><p>We’ve made GPT-5.3-Codex-Spark about 30% faster. It is now serving at over 1200 tokens per second.</p></blockquote><p class="cite">&mdash; <a href="https://twitter.com/thsottiaux/status/2024947946849186064">Thibault Sottiaux</a>, OpenAI</p> <p>Tags: <a href="https://simonwillison.net/tags/openai">openai</a>, <a href="https://simonwillison.net/t...
14時間前

LLMのハルシネーションはなぜ連鎖するのか?自己回帰モデルの誤差累積とプロセス報酬モデルによる技術的考察
Zennの「大規模言語モデル」のフィード
LLMのハルシネーションはなぜ連鎖するのか?自己回帰モデルの誤差累積とプロセス報酬モデルによる技術的考察 はじめに大規模言語モデル(Large Language Model; LLM)の急速な普及に伴い、その信頼性を担保する上での最大の課題としてハルシネーション(事実に基づかないもっともらしい出力)が再定義されています。初期の段階では、これは単純な学習データの不足やプロンプトエンジニアリングの未熟さによるものと考えられてきましたが、2025年以降の最新研究は、これがモデルの基盤となる数学的構造や評価指標の設計に深く根ざした「構造的な必然」である可能性を示唆しています。(Fron...
14時間前

Andrej Karpathy talks about "Claws" Simon Willison's Weblog
<p><strong><a href="https://twitter.com/karpathy/status/2024987174077432126">Andrej Karpathy talks about &quot;Claws&quot;</a></strong></p>Andrej Karpathy tweeted a mini-essay about buying a Mac Mini ("The apple store person told me they are selling like hotcakes and everyone is confused") to tinker with Claws:</p><blockquote><p>I'm definitely a bit sus'd to run OpenClaw specifically [...] But I do love the concept and I think that j...
14時間前

AI Financial Reporting Platform Inscope Raises $14.5 Million
PYMNTS.com
Inscope raised $14.5 million in a Series A funding round to increase the adoption and the capabilities of its artificial intelligence (AI)-powered financial reporting platform designed for use by both enterprises and their accounting firms. The round brings the company’s total funding to $18.8 million, including the $4.3 million it raised in a seed round announced in […]The post AI Financial Reporting Platform Inscope Raises $14.5 Million appeared first on PYMNTS.com.
15時間前

Adding TILs, releases, museums, tools and research to my blog Simon Willison's Weblog
<p>I've been wanting to add indications of my various other online activities to my blog for a while now. I just turned on a new feature I'm calling "beats" (after story beats, naming this was hard!) which adds five new types of content to my site, all corresponding to activity elsewhere.</p><p>Here's what beats look like:</p><p><img src="https://static.simonwillison.net/static/2026/three-beats.jpg" alt="Screenshot of a fragment of a page showing three entries f...
15時間前

First Citizens Seeks New Mergers to Cross Growth Threshold
PYMNTS.com
First Citizens BancShares is looking to make acquisitions that will give it the scale needed to deal with the additional regulations that come into effect when a bank reaches $250 billion in assets, Bloomberg reported Friday (Feb. 20), citing unnamed sources. The bank had $230 billion in assets at the end of December, according to the […]The post First Citizens Seeks New Mergers to Cross Growth Threshold appeared first on PYMNTS.com.
16時間前

Multi-Agent Systems Move Business AI From Chatbot to Operations
PYMNTS.com
For the last two years, enterprise artificial intelligence has been stuck in the assistant phase, a world of smarter emails and faster document summaries that boosted individual productivity but left core business logic untouched. Now, the novelty of the chatbot is giving way to the utility of the agent. The industry is pivoting from […]The post Multi-Agent Systems Move Business AI From Chatbot to Operations appeared first on PYMNTS.com.
16時間前

Taalas serves Llama 3.1 8B at 17,000 tokens/second Simon Willison's Weblog
<p><strong><a href="https://taalas.com/the-path-to-ubiquitous-ai/">Taalas serves Llama 3.1 8B at 17,000 tokens/second</a></strong></p>This new Canadian hardware startup just announced their first product - a custom hardware implementation of the Llama 3.1 8B model (from <a href="https://simonwillison.net/2024/Jul/23/introducing-llama-31/">July 2024</a>) that can run at a staggering 17,000 tokens/second.</p><p>I was going to include a v...
17時間前

Saks Global Pledges $600 Million to Vendors After Court Win
PYMNTS.com
Saks Global received court approval Friday (Feb. 20) for a $1 billion bankruptcy loan, Reuters reported Friday. The financing had been held up by vendors’ concerns that they may not get paid for goods they shipped to the luxury retailer before it declared bankruptcy, according to the report. Saks Global resolved those concerns before […]The post Saks Global Pledges $600 Million to Vendors After Court Win appeared first on PYMNTS.com.
17時間前

Claude Codeエージェント実践 Day 21|レポーティングエージェント設計 — 道具を使うから道具を作るへ
Akiraさんのフィード
TL;DR3体目のエージェント「レポーティングエージェント」を設計した。Python + HTML でダッシュボードを生成する、道具を作る エージェントagent-scaffold-factory テンプレートで雛形を生成し、CLAUDE.md・スキル・ナレッジを設計。テンプレート効果は健在で、設計作業は半日で完了「道具を使う」エージェントと「道具を作る」エージェントでは、CLAUDE.md に書くべきことが根本的に違う。出力品質の制約をどう伝えるかが設計の肝になった 作ったものGitHub: akira-cloudjob-public/reporting-agent...
17時間前

Consumer Spending Persists Despite Slower Income Gains
PYMNTS.com
Consumers continue to shoulder the expansion of the U.S. economy, even as late-year data reveal a more deliberate spending posture and a softer pace of overall growth. Income Growth Moderates as Spending Holds The Bureau of Economic Analysis data for December, released Friday (Feb. 20), showd personal income rising 0.3% month over month, while […]The post Consumer Spending Persists Despite Slower Income Gains appeared first on PYMNTS.com.
17時間前

Ripple CEO Brad Garlinghouse Sees 90% Chance for Crypto Bill Breakthrough
PYMNTS.com
Ripple CEO Brad Garlinghouse thinks there is a 90% chance the CLARITY Act will be signed into law by the end of April, he said in a Thursday (Feb. 19) interview on Fox Business. “The White House is pushing hard on this, and I think that is a big reason why it will get […]The post Ripple CEO Brad Garlinghouse Sees 90% Chance for Crypto Bill Breakthrough appeared first on PYMNTS.com.
18時間前

Telcos Double Down on AI as 90% Report Positive Returns
PYMNTS.com
Telecom operators’ relationship with artificial intelligence (AI) is now defined by results, not rhetoric. Nvidia’s 2026 State of AI in Telecommunications survey, which polled more than 1,000 industry professionals globally, found that 90% of operators say AI is driving positive return on investment (ROI) and boosting both revenue and cost efficiency, while 89% plan to […]The post Telcos Double Down on AI as 90% Report Positive Returns appeared first on PYMNTS.com.
18時間前

Square Ecosystem Nears 1,000 Partners to Fuel Seller Growth
PYMNTS.com
Global business platform Square continues to expand its partner ecosystem and now has almost 1,000 partners in its Square App Marketplace and its Square Specialists directory, the company said in a Thursday (Feb. 19) press release. The company’s partners offer tools that sellers can access on the marketplace and integrate with Square to help […]The post Square Ecosystem Nears 1,000 Partners to Fuel Seller Growth appeared first on PYMNTS.com.
19時間前

OpenAI Deploys 200 Employees to Build AI Smart Devices
PYMNTS.com
OpenAI’s effort to develop artificial intelligence-powered devices involves more than 200 people, The Information reported Friday (Feb. 20), citing unnamed sources. The team is working on devices that include a smart speaker, smart glasses and a smart lamp, according to the report. OpenAI plans to release the smart speaker first, no earlier than February […]The post OpenAI Deploys 200 Employees to Build AI Smart Devices appeared first on PYMNTS.com.
20時間前

ローカルLLMで2万文字のドキュメント分析を試した話 - DeepSeek-R1 32Bの実力検証
Zennの「大規模言語モデル」のフィード
Mac上で動くローカルLLMを使って、同じタスク(2万文字のドキュメント分析)を複数のモデルで実行し、その性能差を比較しました。なぜこのベンチマークをやったかきっかけは、「Claude API の利用料金が気になる」という単純な動機でした。毎月の請求を見るたびに「これ、ローカルでできないかな?」と考えていました。さらに、「API が落ちたら作業が止まる」というリスクも気になっていました。ネット接続が不安定な環境や、深夜にサーバーメンテナンスが入ると、何もできなくなる。ローカルで完結できれば、そういう心配がなくなります。そこで、実際にローカルLLMを試してみることにしました。ただし...
21時間前

ggml.ai joins Hugging Face to ensure the long-term progress of Local AI Simon Willison's Weblog
<p><strong><a href="https://github.com/ggml-org/llama.cpp/discussions/19759">ggml.ai joins Hugging Face to ensure the long-term progress of Local AI</a></strong></p>I don't normally cover acquisition news like this, but I have some thoughts.</p><p>It's hard to overstate the impact Georgi Gerganov has had on the local model space. Back in March 2023 his release of <a href="https://github.com/ggml-org/llama.cpp">llama.cpp</a> made it pos...
1日前

SANDWORM_MODE: Shai-Hulud-Style npm Worm Hijacks CI Workflows and Poisons AI Toolchains
Socket
An emerging npm supply chain attack that infects repos, steals CI secrets, and targets developer AI toolchains for further compromise.
1日前

LLMアプリの品質保証パターン — 教育AIプロダクトの実装から学ぶ
Zennの「大規模言語モデル」のフィード
AIが生成するコンテンツの品質をどう担保するか。教育AIアプリ「MochiQ」の開発経験を通じて得た、LLM出力のバリデーション設計、ハルシネーション対策、プロンプトエンジニアリング、コスト最適化のパターンを体系的に解説します。
1日前

[アップデート]Amazon Qが左に!グラフ表現や全画面表示に対応し便利なプロンプトが使えるようになりました
DevelopersIO
Amazon Qが左になりました!便利なプロンプトや円グラフが使えます。やったね。
1日前
2/20 (金)

Model Reasoningの仕組み (メモ)
Zennの「大規模言語モデル」のフィード
モデルのReasoning(推論)とは大規模言語モデル(LLM)におけるReasoningとは、複雑な問題に対して中間的な思考プロセスを生成しながら論理的に解決策を導き出す能力 大枠の流れ 入力の解釈とタスク分解モデルは入力を受け取ると、それを解決可能な小さなサブタスクに分解します。この挙動は、少数のラベル付きデータによるSupervised Fine-Tuning(SFT)を起点とし、その後の大規模なRLによって、モデル自らが効率的な分解・思考パターンを学習・洗練させるプロセスによって確立。 推論パスの展開と探索モデルは一つの回答を生成するのではなく、複数の推論の...
1日前

生成AI基盤のログ設計と評価基盤の作り方
Zennの「大規模言語モデル」のフィード
生成AI基盤は「モデル精度」ではなく「ログ設計」で成否が決まります。RAGやエージェントのPoCは通る。しかし本番で使われ始めた瞬間に「何が起きているか分からない」という状態になる。このパターンは本当によく見ます。本記事では、生成AI基盤におけるログ設計と評価基盤の作り方を、技術顧問レイヤーの視点で整理します。 生成AI基盤の品質はログ粒度で決まる主張はシンプルです。「あとから改善できる設計」になっているかは、ログがすべてを決めます。 ■ なぜログが重要か生成AIは決定論的システムではありません。同じプロンプトでも揺らぎますし、データ更新でも挙動が変わります。だか...
1日前

Our First Proof submissions
OpenAI News
We share our AI model’s proof attempts for the First Proof math challenge, testing research-grade reasoning on expert-level problems.
1日前

RAGとFine-tuningを設計観点で比較する
Zennの「大規模言語モデル」のフィード
生成AI活用の相談で必ず出る問いがあります。「RAGとFine-tuning、どちらが正解ですか?」私はこの質問が出た瞬間に少し身構えます。正解は技術ではなく、更新構造で決まるからです。本稿では思想論ではなく、設計観点で分解します。 更新コストは式で整理できるまず結論です。頻繁に変わる知識はRAG、安定した判断様式はFine-tuning が合理的です。更新コストを簡略化すると以下のように表せます。RAG更新コスト ≒ C_index + C_embedding × ΔDFT更新コスト ≒ C_train × N_epoch + C_evalΔD:追加・変更ド...
1日前

DynamoDB 障害から学ぶ AWS サービスの依存関係と設計
DevelopersIO
この記事では、2025年10月に発生したAWS大規模障害を通して、DynamoDBの障害がなぜ複数サービスに広がったのかをわかりやすく解説します。
1日前

LLMの指示が無視される?プロンプト分割で解決した話
Zennの「大規模言語モデル」のフィード
LLMの指示が無視される?プロンプト分割で解決した話 指示が無視される問題RAGシステムで回答を生成する際、1つのプロンプトに大きく2種類の指示を入れていた。回答生成のための指示日本語校正のための指示しかし、日本語校正の指示が無視されることがあった。たとえば、「である調」が混在したり、略語のルールが守られなかったりした。以下はダミーデータで再現した例。実際のプロンプトはもっと長いが、構造を示すために簡略化している。プロンプト(構造のイメージ)あなたは社内文書検索システムのアシスタントです。# 役割の定義(数十行の指示: ペルソナ、回答方針、禁止事項など)...
1日前

How to Write a Good Spec for AI Agents
1
Radar
This post first appeared on Addy Osmani’s Elevate Substack newsletter and is being republished here with the author’s permission. TL;DR: Aim for a clear spec covering just enough nuance (this may include structure, style, testing, boundaries. . .) to guide the AI without overwhelming it. Break large tasks into smaller ones versus keeping everything in one large […]
1日前

Aurora DSQL Python Connector がリリースされたので、Lambda で性能を実測比較してみた (psycopg2 vs asyncpg)
DevelopersIO
Aurora DSQLのPython公式コネクタをLambdaで最速検証!psycopg2とasyncpgの性能比較に加え、x86 vs Gravitonの実測データも公開。接続オーバーヘッドをなくすコネクション再利用の手法と、本番運用で直面する「接続レート制限」の回避策をまとめました。
1日前

[アップデート] Amazon ECS が Network Load Balancer での線形デプロイ・カナリアデプロイをサポートしました!
DevelopersIO
[アップデート] Amazon ECS が Network Load Balancer での線形デプロイ・カナリアデプロイをサポートしました!
1日前

Qwen3-Swallow & GPT-OSS-Swallow
43
Zennの「大規模言語モデル」のフィード
はじめに東京科学大学 修士2年の藤井です。本日(2026/02/20)、Swallow LLM Projectから、Qwen3-Swallow-v0.2、GPT-OSS-Swallow-v0.1をリリースさせていただきました。これらのモデルは、それぞれAlibaba Qwen3とOpenAI GPT-OSSから日本語、英語、数学、コード、科学分野のデータセットを用いて、継続事前学習(Continual Pre-Training)、SFT(Supervised Fine-Tuning) を行い、その後、数学データセットを用いてRLVR(Reinforcement Learning ...
1日前

Gemini 3.1 Proで構築するマルチエージェント協調コーディングの実践手法
Zennの「大規模言語モデル」のフィード
Gemini 3.1 Proで構築するマルチエージェント協調コーディングの実践手法 この記事でわかることGemini 3.1 Proのthought signaturesでエージェント間の推論状態を維持する方法thinking_level制御(high/medium/low)でコストと精度を最適化する設計パターンADK(Agent Development Kit)によるマルチエージェントオーケストレーション実装実運用で陥りやすい3つの制約と回避策 対象読者想定読者: LLMコーディングエージェントの開発経験がある中級〜上級エンジニア前提知識: Pyth...
1日前

Quoting Thariq Shihipar Simon Willison's Weblog
<blockquote cite="https://twitter.com/trq212/status/2024574133011673516"><p>Long running agentic products like Claude Code are made feasible by prompt caching which allows us to reuse computation from previous roundtrips and significantly decrease latency and cost. [...]</p><p>At Claude Code, we build our entire harness around prompt caching. A high prompt cache hit rate decreases costs and helps us create more generous rate limits for our subscription plans, so we run a...
1日前

新品Mac MiniをAIニュース配信マシンに育てる——OpenClaw × Slack 自動化構築ガイド
Zennの「大規模言語モデル」のフィード
はじめにチームにAIエージェントの OpenClaw を導入しました。各メンバーがOpenClaw専用のSlackワークスペースを個別に作成し、それぞれのワークスペースでAIエージェントと対話する構成です。この記事はもともとチームメンバー向けのセットアップ手順書として書いたものですが、ハマりどころも含めてそのまま公開してみます。!対象読者: AIエージェントに興味があるけどコードはそんなに書かない、という方向けに書いています。コマンドラインは少し出てきますが、コピペで進められます。!この記事の内容は 2026年2月19日時点 の情報です。OpenClawは活発に開発が進...
1日前

AIプロダクト開発における AI Tech PdM の5つの責任範囲
KAKEHASHI Tech Blog
はじめに こんにちは。カケハシで生成AIプロダクトの Product Lead/PdM をしている高梨です。 つい最近、我々のチームにAI技術に特化した AI Tech PdM がJOINしてくれました!! 迎え入れた経緯や詳細な理由をここで細かく語ることはできないのですが、端的に言えば、急速に進化する生成AIを複数機能としてプロダクトに組み込むにあたり、プロダクトを持続可能な形で開発するためには、実現技術とAIの精度に責任を持つ人材が必要不可欠と考えたためです。 この記事は、我々のチームにおける(我々が開発しているAIプロダクト開発における)PdM と Tech PdM の役割の違いと責任分…
1日前

チーム専用の Claude Code Plugin マーケットプレイスを作った話
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事はkintoneの生成AIチームで連載中の kintone AI リレーブログ 2026 の 5 本目の記事です。リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone の生成 AI チームでバックエンド開発・運用を担当している齋藤です。日頃 AI 機能やその基盤の開発・運用などの業務に取り組んでいる私たちですが、 今回は私たちが AI をどのように活用しているのかという話の一つとして、 チーム専用の Claude Code の Plugin マーケットプレイス を作った話を紹介します。Claude Code の導入と「配布」の課題Cybozu では、昨年(2025年)夏ごろからコーディングエージェントツールとして Claude Code を導入しておりました。今年からは Claude の Team Plan が全社展開されるようにもなり、AI ツールの活用はますます加速しています。Claude Code を使い始めると、各メンバーがそれぞれに便利なプロンプトを書いたり、MCP Server を
1日前

DSPyでドメインエキスパートに挑んだ結果、返り討ちにあった話
Zennの「大規模言語モデル」のフィード
こんにちは!COTENでAIリサーチャーをしているtakaです。COTENでは世界史データベースの構築において、AI技術をどう活かせるかを調査・検証しています。この記事では、世界史データベースの構築のタスクの一つ、「歴史イベント文の正規化」でDSPyによるPromptの自動最適化を試みた際の知見を共有します。タイトルにある通り、結果はドメインエキスパートの知見には勝てなかったのですが、そこから得られた「DSPyが輝く場所・そうでない場所」の学びは大きかったので、失敗談として共有させてください。TL;DR情報抽出タスクで、DSPyによる自動Prompt最適化(MIPROv2)を...
1日前

Go 向けの Amazon Aurora DSQL コネクターもリリースされたので使ってみた
DevelopersIO
Go 向けの Amazon Aurora DSQL コネクターもリリースされたので使ってみた
1日前

なぜ、AI時代には文系人間こそが真のエンジニアになるのか?
Zennの「大規模言語モデル」のフィード
はじめにAIが広がるとプログラマーが不要になるとよく言われますが実際にはそうなりません。変わるのは人数ではなく仕事の中身です。この変化を理解する鍵が文系的思考と解釈能力と前提理解です。昔のエンジニアは機械を相手にしていました。これからのエンジニアは人間の理解のズレを相手にします。そのため活躍する人のタイプが変わります。本稿では高校生でもイメージできる例を使いながら説明します。結論は単純です。AI時代のエンジニアは機械を直す人から意味を設計する人へ変わります。 機械を直す仕事から意味を直す仕事へ昔のバグはパソコンの中で起きていました。例えば配列の長さを間違えた...
1日前

【開発手法】Webアプリ界隈でオレオレAI駆動開発が生まれると思うと、今から頭痛が痛いので予防策を記しておこうと思う
Zennの「大規模言語モデル」のフィード
はじめにhttps://zenn.dev/noranuko13/articles/b30c8ed65e8e27 対象読者Webアプリ界隈でオレオレAI駆動開発に戦々恐々としているITエンジニア向け。詳しく書くと本になってしまうので、大事な考え方だけ絞って先に記事にしようかと。 オレオレAI駆動開発がヤバい!!ヤベー現場に入ったことがある方は、なんとなく分かってしまうのでは。 既存のオレオレより自由度が高い今までも業務中にオレオレを見かけることはありました。オレオレフレームワーク・オレオレライブラリなど。前任者が面倒を見切れなくなり、後任者が保守性の低さと...
2日前

Vol.05 Sansan Data Intelligence CRE組織立ち上げの現在地
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第5弾です。 こんにちは。技術本部 Data Intelligence Engineering Unit Data Hubグループの髙芝です。 2025年12月のSDI(Sansan Data Intelligence)ローンチから約2カ月。これまでのブログリレーでは、SDIを支えるアーキテクチャやデータ基盤の深部についてお伝えしてきました。 本日は、その技術を「顧客の信頼」へと繋ぐための挑戦——CRE(Customer Reliability Engineering)組織の立ち上げの現在地についてお話し…
2日前

[アップデート] AWS Certificate Managerのパブリック証明書の有効期間が395日から198日に短縮されました
DevelopersIO
[アップデート] AWS Certificate Managerのパブリック証明書の有効期間が395日から198日に短縮されました
2日前

OpenTacoで複数のAWSアカウントにリソースをデプロイしてみる(AWSプロファイルでIAMロール切替)
DevelopersIO
OpenTacoで複数のAWSアカウントにリソースをデプロイしてみる(AWSプロファイルでIAMロール切替)
2日前

確率的生成プロセスに潜むLLMの「バイアス」と、実用における妥協点の考察
Zennの「大規模言語モデル」のフィード
確率的生成プロセスに潜むLLMの「バイアス」と、実用における妥協点の考察 考察大規模言語モデル(LLM)における文脈依存性について、直前のコンテキストに影響を受ける現象は、厳密な意味でのバイアスとは異なるものの、出力の偏向という実質的な観点から「バイアス(position biasやrecency bias等)」として議論されるケースがあります。推論能力を高めたモデルは、自身の出力プロセスを検証するメタ認知的な機能を有していると評価されることがありますが、基盤となる技術はあくまで確率的予測の延長線上に位置づけられます。人間の認知プロセス(システム1など)が生存戦略としてバイア...
2日前

AIエージェントの推論プロセスを読み解く:OpenCodeのコードリーディングから
Zennの「大規模言語モデル」のフィード
はじめに:モデルの賢さだけではないエージェントの能力日頃、Claude CodeやOpenCodeなどのAIコーディングエージェントを使っていると、そのアウトプットの質の高さに驚かされることがよくある。この際に、各社の最新フロンティアモデルの能力に目が向きがちだが、冷静に考えると、優れたアウトプットを生み出しているのはモデル単体の能力だけではないはずである。これらのエージェントがLLMをどのように呼び出し、その応答をどう処理し、次のアクションにどうつなげているか。この「推論プロセスの設計」こそが、エージェントの実力を左右するもうひとつの重要な要素である。しかし、普段ツールを使って...
2日前

Google Cloud でログ運用管理をする上で知っておくべき基礎知識
DevelopersIO
Google Cloud のログ運用管理に必要な基礎知識を解説します。Cloud Logging のアーキテクチャ、ログシンク・ログバケットの仕組み、組織レベルでのログ集約、コスト最適化の考慮事項など重要なポイントを説明します。
2日前

Amazon Q in Connect と ServiceNow 統合時、大量のナレッジ記事に対するタグ付けを実装してみた
DevelopersIO
Amazon Q in Connect と ServiceNow 統合時、大量のナレッジ記事に対するタグ付けを実装してみた
2日前

UXって何だろう?① 〜使いやすさの正体と、UIとUXの決定的な違い〜
DevelopersIO
UIとUXの違いを「モノ(名詞)」と「コト(動詞)」で整理。どんなに美しい画面でも「使いにくい」と言われる理由とは?
2日前

LLMプロダクトの評価はどう考えてどうやればいいの?
Zennの「大規模言語モデル」のフィード
!本稿における「LLMプロダクト」は、LLMを用いたプロダクトや機能のことを意味します。 モチベーションLLMプロダクトの評価は難しい。人事評価がとても難しいように、一見優秀に見えるLLMの主張やAIエージェントの行動を、一体どのように相対的に評価すれば良いのか。頭を抱えている方も多いと思います。何を隠そう、かく言う私も頭を抱え続けている一人です。という訳で、本稿では、LLMプロダクトをどのように評価すべきか、基本的な考え方を今一度整理することを目的に、現時点の情報をもとに調査した内容をまとめました。 なぜ評価を行うのか?そもそもなぜ評価を行う必要があるのでしょうか...
2日前

自社サービスの知識をClaude Codeに覚えさせたかったのでMCPサーバーを作ってみた
DevelopersIO
自社サービスの知識をClaude Codeに覚えさせたかったのでMCPサーバーを作ってみた
2日前

Recovering lost code Simon Willison's Weblog
<p>Reached the stage of parallel agent psychosis where I've lost a whole feature - I know I had it yesterday, but I can't seem to find the branch or worktree or cloud instance or checkout with it in.</p><p>... found it! Turns out I'd been hacking on a random prototype in <code>/tmp</code> and then my computer crashed and rebooted and I lost the code... but it's all still there in <code>~/.claude/projects/</code> session logs and Claude Code can extract ...
2日前

AIと自分のテスト分析を比較してみた
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の131週目の記事です!3年間連続達成まで残り28週となりました!こんにちは、株式会社ログラスでQAエンジニアをやっている森島です。さて、みなさん生成AI(以下、AI)を活用していますか?ログラスでもAIの活用は積極的に進めており、テスト工程における活用も例外ではありません。特に最近はテストでの活用事例が増えており、私も波に乗り遅れまいと情報を追いかけたり、実際に活用してみたりと日々奮闘中です。要求仕様書や仕様書をAIに与えてテスト分析をさせてみると、テストすべき項目やリスクを瞬時...
2日前

Claude Codeエージェント実践 Day 20|Week 3 振り返り — 1体のエージェントからチームへ
Akiraさんのフィード
今日のゴールWeek 3(Day 15-19)で取り組んだ「エージェントモデリング → n8n エージェントの育成」を振り返り、Week 2 との違いを分析する。得られた教訓を整理し、Week 4 の計画を立てる。 前提条件Day 15〜19 の記事を読んでいると背景が掴みやすい。ただし、各パターンは単独でも読めるように書いているので、「振り返り記事だけ追う」読み方でも大丈夫です。 TL;DRWeek 3 では 1体のエージェント → 2体のチーム にスコープを拡大した。単体では見えなかった「エージェント間の引き継ぎ」という課題が浮上し、スキルで解決したWeek 2...
2日前

Socket Joins the OpenJS Foundation
Socket
Socket is proud to join the OpenJS Foundation as a Silver Member, deepening our commitment to the long-term health and security of the JavaScript ecosystem.
2日前

Gemini 3.1 Pro Simon Willison's Weblog
<p><strong><a href="https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/">Gemini 3.1 Pro</a></strong></p>The first in the Gemini 3.1 series, priced the same as Gemini 3 Pro ($2/million input, $12/million output under 200,000 tokens, $4/$18 for 200,000 to 1,000,000). That's less than half the price of Claude Opus 4.6 with very similar benchmark scores to that model.</p><p>They boast about its improved SVG animatio...
2日前

【Amazon Connect】Streams API で Contact Control Panel (CCP) を Windows EC2 と統合してみた
DevelopersIO
【Amazon Connect】Streams API で Contact Control Panel (CCP) を Windows EC2 と統合してみた
2日前

GitHub、リポジトリに対するプルリクエストをコラボレーターのみに制限する、あるいは完全に無効にする設定を可能に
Publickey
GitHubは、リポジトリの設定として新たな設定を2つ追加したことを発表しました。 1つはコラボレーターのみにプルリクエストを制限する設定、もう1つは完全にプルリクエストを無効する設定です。 コラボレーターのみにプルリクエストを制限すると、...
2日前
2/19 (木)

Packaging Expertise: How Claude Skills Turn Judgment into Artifacts
Radar
Think about what happens when you onboard a new employee. First, you provision them tools. Email access. Slack. CRM. Office software. Project management software. Development environment. Connecting a person to the system they’ll need to do their job. However, this is necessary but not sufficient. Nobody becomes effective just because they can log into Salesforce. […]
2日前

What Developers Actually Need to Know Right Now
Radar
The following article includes clips from a recent Live with Tim O’Reilly interview. You can watch the full version on the O’Reilly Media learning platform. Addy Osmani is one of my favorite people to talk with about the state of software engineering with AI. He spent 14 years leading Chrome’s developer experience team at Google, […]
2日前

Advancing independent research on AI alignment
OpenAI News
OpenAI commits $7.5M to The Alignment Project to fund independent AI alignment research, strengthening global efforts to address AGI safety and security risks.
2日前

失敗から学んだ仕様駆動開発――チームの暗黙知を形式知化した1ヶ月の実践と次の課題
Timee Product Team Blog
「AIで開発生産性は劇的に上がるのか?」開発チームがcc-sddを用いた仕様駆動開発(SDD)に挑戦。手戻り減少という成果の一方で、デプロイ頻度のデータから見えてきた要件定義のボトルネックなど、リアルな実践記録と学びを紹介します。
2日前

ニッチアイテムを好むヘビーユーザーに着目した人気バイアスの緩和
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでデータサイエンティストをしている林 (@python_walker) です。この記事...
2日前

デブサミ2026 Day2 初参加レポート
カミナシ エンジニアブログ
はじめに 「カミナシ レポート」を開発しているかわりくです! 日本最大級のテックカンファレンス、Developers Summitに初参加してきました。 2日目のセッションの感想や持ち帰れそうなことをメモっております。 会場の雰囲気は、デデデデカイ!規模がデカい!今まで参加したどのカンファレンスよりも人の数と会場のキャパシティと、ブースの数が桁違い...!スタッフさんも多い...!ありがとうスタッフさん...! タダでサンドイッチもらってごめんなさい...!スタッフさんの分まで楽しみます! 興奮しながらの入場となりました。 (2026/2/19終了後、最速レポとして投稿されたものです。) be…
2日前

Claude Code の Agent Skills を活用してリポジトリのオンボーディングを効率化する
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでバックエンドエンジニアをしている小室 (@nekorush14) です。今回は、Cl...
2日前

Experimenting with sponsorship for my blog and newsletter Simon Willison's Weblog
<p>I've long been resistant to the idea of accepting sponsorship for my blog. I value my credibility as an independent voice, and I don't want to risk compromising that reputation.</p><p>Then I learned about Troy Hunt's <a href="https://www.troyhunt.com/sponsorship/">approach to sponsorship</a>, which he first wrote about <a href="https://www.troyhunt.com/im-now-offering-sponsorship-of-this-blog/">in 2016</a>. Troy runs with a simple text row in the pag...
2日前

SWE-bench February 2026 leaderboard update Simon Willison's Weblog
<p><strong><a href="https://www.swebench.com/">SWE-bench February 2026 leaderboard update</a></strong></p>SWE-bench is one of the benchmarks that the labs love to list in their model releases. The official leaderboard is infrequently updated but they just did a full run of it against the current generation of models, which is notable because it's always good to see benchmark results like this that <em>weren't</em> self-reported by the labs.</p&...
2日前

Socket Security Analysis Is Now One Click Away on npm
Socket
npm now links to Socket's security analysis on every package page. Here's what you'll find when you click through.
3日前

Kotlin Fest 2025:コードレビュー問題集 LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。Yahoo!オークションでAndroidアプリの開発を担当している高松です。2025年11月1日(土)に開催されたKotlin Fest 2025にて、LINEヤフー株式会社は「ことりプラ...
3日前

LadybirdBrowser/ladybird: Abandon Swift adoption
Simon Willison's Weblog
<p><strong><a href="https://github.com/LadybirdBrowser/ladybird/commit/e87f889e31afbb5fa32c910603c7f5e781c97afd">LadybirdBrowser/ladybird: Abandon Swift adoption</a></strong></p>Back <a href="https://simonwillison.net/2024/Aug/11/ladybird-set-to-adopt-swift/">in August 2024</a> the Ladybird browser project announced an intention to adopt Swift as their memory-safe language of choice.</p><p>As of <a href="https://github.com/LadybirdB...
3日前

場所を理由に挑戦を諦めない。Sansanが地方拠点採用を強化する理由
Sansan Tech Blog
年末に、新卒で東京に来て以来初めて引越しをしたCTOの笹川です。 引越し先も、引越し前と同じ都内ですが、今回は東京以外のSansanの地方拠点について書いてみようと思います(本題と関係ないですが、笹川は札幌出身です)。 Sansanには、渋谷にある本社オフィスの他に、たくさんの地方拠点があるのをご存知でしょうか。 この記事では、Sansanが地方拠点においてエンジニア採用を強化している理由と、地方拠点で働くメリットについてお伝えしたいと思います。 この記事を読んで少しでも興味を持った方は、以下のカジュアル面談フォームよりご応募ください。オンライン、オフライン問わず、笹川をはじめSansanのエ…
3日前

Claude Codeエージェント実践 Day 19|引き継ぎスキルと受付チェックで PLACEHOLDER を根絶する
Akiraさんのフィード
TL;DRDay 18 で設計したエージェント間インターフェースを 2つのスキルとして実装した分析エージェント → /handover(引き継ぎ書を構造化して出力する)n8n エージェント → /reception-check(情報が揃っているか検証し、不足があれば聞き返す)改善版の引き継ぎ書でワークフロー再生成したところ、Day 17 で 10 個あったエラーが 1 個に減ったエージェント間の品質は「引き継ぎの情報密度」で決まる。スキルで構造化すれば、毎回同じ品質で渡せる 作ったもの/handover スキル — 分析エージェントの SKILL.md...
3日前

Introducing OpenAI for India
OpenAI News
OpenAI for India expands AI access across the country—building local infrastructure, powering enterprises, and advancing workforce skills.
3日前

Typing without having to type Simon Willison's Weblog
<p>25+ years into my career as a programmer I think I may <em>finally</em> be coming around to preferring type hints or even strong typing. I resisted those in the past because they slowed down the rate at which I could iterate on code, especially in the REPL environments that were key to my productivity. But if a coding agent is doing all that <em>typing</em> for me, the benefits of explicitly defining all of those types are suddenly much more attractive.</p>...
3日前

The A.I. Disruption We’ve Been Waiting for Has Arrived Simon Willison's Weblog
<p><strong><a href="https://www.nytimes.com/2026/02/18/opinion/ai-software.html?unlocked_article_code=1.NFA.UkLv.r-XczfzYRdXJ&amp;smid=url-share">The A.I. Disruption We’ve Been Waiting for Has Arrived</a></strong></p>New opinion piece from Paul Ford in the New York Times. Unsurprisingly for a piece by Paul it's packed with quoteworthy snippets, but a few stood out for me in particular.</p><p>Paul describes the <a href="https://simonwillison...
3日前

Cline CLI npm Package Compromised via Suspected Cache Poisoning Attack
Socket
A compromised npm publish token was used to push a malicious postinstall script in cline@2.3.0, affecting the popular AI coding agent CLI with 90k weekly downloads.
3日前

Quoting Martin Fowler Simon Willison's Weblog
<blockquote cite="https://martinfowler.com/fragments/2026-02-18.html"><p>LLMs are eating specialty skills. There will be less use of specialist front-end and back-end developers as the LLM-driving skills become more important than the details of platform usage. Will this lead to a greater recognition of the role of <a href="https://martinfowler.com/articles/expert-generalist.html">Expert Generalists</a>? Or will the ability of LLMs to write lots of code mean they code ar...
3日前

Amazon EC2が仮想化のネスト(Nested Virtualization)に対応。KVMやHyper-Vを用いた仮想マシンを設定可能に
Publickey
Amazon Web Services(AWS)は、Amazon EC2のベアメタルインスタンス以外のインスタンスでも仮想化のネスト(Nested Virtualization)が可能になったことを発表しました。 以前からAmazon EC...
3日前

Slackが「リアルタイムサーチAPI」と「Slack MCP Server」を発表。生成AIがSlack上のやりとりを基にコンテキストを理解可能
Publickey
企業向けチャットサービスのSlackは、リアルタイムサーチAPIと、生成AIがSlackを操作できる「Slack MCP Server」の提供を発表しました。 For every type of problem and task, ther...
3日前

【イベントレポート】『ホットペッパーグルメ』を動かすデータマネジメント~アナリティクスエンジニアの挑戦と裏側~
Recruit Data Blog
はじめに こんにちは、Recruit Data Blog 担当の森です。 2026年1月20日、リクルートの飲食事業である『ホットペッパーグル
3日前
2/18 (水)

AI Is Not a Library: Designing for Nondeterministic Dependencies
Radar
For most of the history of software engineering, we’ve built systems around a simple and comforting assumption: Given the same input, a program will produce the same output. When something went wrong, it was usually because of a bug, a misconfiguration, or a dependency that wasn’t behaving as advertised. Our tools, testing strategies, and even […]
3日前

Vol.04 新規プロダクト立ち上げにデータサイエンティストチームがどう貢献するか
Sansan Tech Blog
この記事は、Sansan Data Intelligence開発Unitブログリレーの第4弾です。 はじめに 技術本部 研究開発部の小松です。Data Direction Groupに所属し、社内外のデータ活用推進に従事しています。最近は新プロダクトSansan Data Intelligence(SDI)の立ち上げに注力しています。 SDIでは、プロダクトの立ち上げ段階からデータサイエンティストで構成されるチームが参画しています。本記事では、SDIの現場でデータサイエンティストチームが実際にどのように動き、事業貢献しているかを紹介します。
3日前

Introducing Claude Sonnet 4.6 Simon Willison's Weblog
<p><strong><a href="https://www.anthropic.com/news/claude-sonnet-4-6">Introducing Claude Sonnet 4.6</a></strong></p>Sonnet 4.6 is out today, and Anthropic claim it offers similar performance to <a href="https://simonwillison.net/2025/Nov/24/claude-opus/">November's Opus 4.5</a> while maintaining the Sonnet pricing of $3/million input and $15/million output tokens (the Opus models are $5/$25). Here's <a href="https://www-cdn.anthropic.com/78073f...
4日前

Rodney v0.4.0 Simon Willison's Weblog
<p><strong><a href="https://github.com/simonw/rodney/releases/tag/v0.4.0">Rodney v0.4.0</a></strong></p>My <a href="https://github.com/simonw/rodney">Rodney</a> CLI tool for browser automation attracted quite the flurry of PRs since I announced it <a href="https://simonwillison.net/2026/Feb/10/showboat-and-rodney/#rodney-cli-browser-automation-designed-to-work-with-showboat">last week</a>. Here are the release notes for the just-releas...
4日前

Claude Codeエージェント実践 Day 18|エージェント間の知識引き継ぎで n8n ワークフローを動かす
Akiraさんのフィード
TL;DRエージェントが生成したワークフローを実際に動かしたら 10 個のエラーが出た。原因はすべて「引き継ぎ不足」エラーを 3 カテゴリ(接続情報 / n8n 固有仕様 / 実行前提)に分類し、エージェント間のインターフェースを設計した分析エージェントに「引き継ぎ」スキル、n8n エージェントに「受付チェック」スキルを持たせれば、PLACEHOLDER 問題は構造的に解消できる 作ったもの引き継ぎ書テンプレート / 受付チェックリスト — エージェント間インターフェースの設計(本記事内に掲載)n8n-workflow-agent リポジトリ — 準備中(スキ...
4日前

Socket Brings Supply Chain Security to skills.sh
Socket
Socket is now scanning AI agent skills across multiple languages and ecosystems, detecting malicious behavior before developers install, starting with skills.sh's 60,000+ skills.
4日前

Introducing PHP and Composer Support in Socket
Socket
Socket now supports PHP with full Composer and Packagist integration, enabling developers to search packages, generate SBOMs, and protect their PHP dependencies from supply chain threats.
4日前

マイクロソフト、.NETランタイムでWebAssemblyの実行をサポートへ、CoreCLRに実装を開始
Publickey
マイクロソフトは2月10日付けで公開した.NET 11 Preview 1において、.NETランタイムでWebAssemblyの実行をサポートする作業を開始していることを明らかにしました。 完成は来年の.NET 12かそれ以後の予定 .NE...
4日前

中国アリババ、MySQLのブランチとしてInnoDBエンジン、DuckDBカラムナエンジン、ベクトルサーチなどを統合した「AliSQL 8.0」オープンソースで公開
Publickey
中国のAlibaba Cloudデータベースチームは、MySQLのブランチとしてOLTP用のInnoDB、OLAP用のDuckDBカラムナエンジン、そしてベクトルサーチ機能を統合した「AliSQL 8.0」をオープンソースで公開しました。 ...
4日前
2/17 (火)

Quoting ROUGH DRAFT 8/2/66 Simon Willison's Weblog
<blockquote cite="https://www.neatorama.com/2026/02/11/The-Original-Drafts-for-Star-Treks-Opening-Narration/"><p>This is the story of the United Space Ship Enterprise. Assigned a five year patrol of our galaxy, the giant starship visits Earth colonies, regulates commerce, and explores strange new worlds and civilizations. These are its voyages... and its adventures.</p></blockquote><p class="cite">&mdash; <a href="https://www.neatorama.com/2026/02/11/The-Ori...
4日前

First kākāpō chick in four years hatches on Valentine's Day Simon Willison's Weblog
<p><strong><a href="https://www.doc.govt.nz/news/media-releases/2026-media-releases/first-kakapo-chick-in-four-years-hatches-on-valentines-day/">First kākāpō chick in four years hatches on Valentine&#x27;s Day</a></strong></p>First chick of <a href="https://simonwillison.net/2026/Jan/8/llm-predictions-for-2026/#1-year-k-k-p-parrots-will-have-an-outstanding-breeding-season">the 2026 breeding season</a>!</p><blockquote><p>Kākāp...
4日前

Quoting Dimitris Papailiopoulos Simon Willison's Weblog
<blockquote cite="https://twitter.com/dimitrispapail/status/2023080289828831349"><p>But the intellectually interesting part for me is something else. <strong>I now have something close to a magic box where I throw in a question and a first answer comes back basically for free, in terms of human effort</strong>. Before this, the way I'd explore a new idea is to either clumsily put something together myself or ask a student to run something short for signal, and if it's th...
4日前

AI, A2A, and the Governance Gap
Radar
Over the past six months, I’ve watched the same pattern repeat across enterprise AI teams. A2A and ACP light up the room during architecture reviews—the protocols are elegant, the demos impressive. Three weeks into production, someone asks: “Wait, which agent authorized that $50,000 vendor payment at 2 am?“ The excitement shifts to concern. Here’s the […]
4日前

Vol.03 SOCv2: MasterData as a Service (MDaaS) 10年もののSystemを作り替える
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第3弾です。 こんにちは、技術本部 Data Intelligence Engineering Unitの Makoto Nagai です。 今までの記事では、Sansan Data Intelligence(SDI)の顧客が利用するSystemについて焦点を当てて紹介しましたが、今回はSDIが利用しているMaster Data Systemについて紹介したいと思います。 このMaster Data Systemは、Sansanで使われている名寄せ、識別、Master DataのSystemを作り替える目…
4日前

Next.jsでSSR専用モジュールがCSRバンドルに混入する問題をwebpackで解決する
Wantedly Engineer Blog
はじめに背景IP アドレス制限Apollo Client の構成問題: Cannot find module "f...
4日前

Nano Banana Pro diff to webcomic Simon Willison's Weblog
<p>Given the threat of <a href="https://simonwillison.net/tags/cognitive-debt/">cognitive debt</a> brought on by AI-accelerated software development leading to more projects and less deep understanding of how they work and what they actually do, it's interesting to consider artifacts that might be able to help.</p><p>Nathan Baschez <a href="https://twitter.com/nbaschez/status/2023501535343509871">on Twitter</a>:</p><blockquote><p>my cu...
4日前

Qwen3.5: Towards Native Multimodal Agents Simon Willison's Weblog
<p><strong><a href="https://qwen.ai/blog?id=qwen3.5">Qwen3.5: Towards Native Multimodal Agents</a></strong></p>Alibaba's Qwen just released the first two models in the Qwen 3.5 series - one open weights, one proprietary. Both are multi-modal for vision input.</p><p>The open weight one is a Mixture of Experts model called Qwen3.5-397B-A17B. Interesting to see Qwen call out serving efficiency as a benefit of that architecture:</p><blockquot...
4日前

なぜ、kintoneにプラットフォームエンジニアリング部は生まれたのか
Cybozu Inside Out | サイボウズエンジニアのブログ
「この部って具体的に何をするんだろう?」プラットフォームエンジニアリング部に配属されて、最初に浮かんだのはそんな戸惑いにも似た疑問でした。aki (@aki366) です。kintoneの開発部門には、「プラットフォームエンジニアリング部(以下、PfE部)」があります。社内外からも、「kintoneのPfE部って何をする部なの?」「なぜ今、このタイミングで立ち上がったの?」といった声をよく耳にしますし、それは私自身が抱いていた疑問でもありました。そこで今回、PfE部立ち上げを牽引してきたお二人に直接インタビューしました。本記事では、PfE部が生まれた背景や狙いを、対談形式でひも解く3部作のインタビューをお届けします。PfE部ができた生い立ちについてお送りします。「kintoneのPfE部って、なんだろう?」この記事の構成は以下の通りです。「この部って具体的に何をするんだろう?」自己紹介なぜ今、PfE部が生まれたのかQ. PfE部が立ち上がる前って、どんな状況だったんでしょうか?Q. もしこのままバックエンドのままだったら、厳しかったポイントってありますか?Q. PfE部を立ち上げると決
5日前

cdk8s を使ってみた! - TypeScript で Kubernetes マニフェストを管理する
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone の生成 AI チームで連載中の kintone AIリレーブログ 2026 の 4 本目の記事です。 リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone 生成 AI チームの 386jp です。突然ですが、みなさんは Kubernetes のマニフェストをどのように生成・管理していますでしょうか?ArgoCD で GitOps を実践されている方であれば、Kustomize や Helm、Jsonnet などのツールで管理されているかと思います。サイボウズでも、これらのツールを活用してマニフェストを生成していることが多いです。これらのツールは非常に強力ですが、それぞれ独自の記法が採用されており、構文でつまづくことがあるという共通の課題があります。Helm は Go テンプレートの知識が必要で、Jsonnet も独自の記法を覚える必要があり、Kustomize も overlay の仕組みでつまづくケースがあります。そこで、 kintone 生成 AI チームでは、 cdk
5日前

未来のクラウドを創る LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。クラウドサービスCBUに所属し、開発サービスを支えるプライベートクラウドを担当しているYoung Hee Parkです。LINEヤフーでは、エンジニアがサービス開発に必要とするインフラおよ...
5日前

似た商品が見つかる! Yahoo!ショッピングの類似画像検索 〜 近傍探索NGTの導入事例 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2019年7月3日)を、現在のブログへ移管したものです。内容は初出時点のものです。Yahoo!ショッピングの大元です。この度、類似画像検索のサービ...
5日前

1ミリ秒でも速く。地震の揺れを可視化する「リアルタイム震度」の処理の工夫 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2021年3月8日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。こんにちは。Yahoo!天気・災害...
5日前

Two new Showboat tools: Chartroom and datasette-showboat Simon Willison's Weblog
<p>I <a href="https://simonwillison.net/2026/Feb/10/showboat-and-rodney/">introduced Showboat</a> a week ago - my CLI tool that helps coding agents create Markdown documents that demonstrate the code that they have created. I've been finding new ways to use it on a daily basis, and I've just released two new tools to help get the best out of the Showboat pattern. <a href="https://github.com/simonw/chartroom">Chartroom</a> is a CLI charting tool that works well with...
5日前

Musubi バックエンドの Python 開発環境を mise + uv へ移行しました(思ったより簡単)
KAKEHASHI Tech Blog
Musubi 開発チームおよびサーバサイド Python 研究会の加藤です。最近は冷えますね。 私のチームで開発している Musubi のバックエンドは Python で実装されていますが、そのパッケージおよびランタイム管理の変遷を追ってみると 2017〜: requirements.txt + Docker 2022〜現在: Poetry + pyenv (via anyenv) となっていて、ここ4年ほどは変わっていません。 最近は mise や uv が流行っており 1、 しかも高速と聞いているので CI/CD の高速化も狙って導入することにしました。 Musubi バックエンドの構成 …
5日前

Claude Codeエージェント実践 Day 17|n8nエージェントにワークフローを作らせてみた
Akiraさんのフィード
TL;DR部下育成モデル Phase 2(やらせてみる)として、n8n ワークフローエージェントに初めて実タスクを与えたIssue に要件を書いて渡したら、Phase 0〜5 を自律的に進め、7ノードのワークフロー JSON + ドキュメント2点を生成したPublic API 経由のインポートでは認証トークンの違い(MCP用 vs API用)で詰まったが、エージェント自身がリトライで解決した 作ったものn8n ワークフロー「週次_地域別売上レポート」src/REQ-001/├── 週次_地域別売上レポート.json ← ワークフロー JSON(7ノード)├...
5日前

Rodney and Claude Code for Desktop
Simon Willison's Weblog
<p>I'm a very heavy user of <a href="https://code.claude.com/docs/en/claude-code-on-the-web">Claude Code on the web</a>, Anthropic's excellent but poorly named cloud version of Claude Code where everything runs in a container environment managed by them, greatly reducing the risk of anything bad happening to a computer I care about.</p><p>I don't use the web interface at all (hence my dislike of the name) - I access it exclusively through their native iPhone and Ma...
5日前

生成AIがGoogleテクノロジーの公式ドキュメントを参照できる「Developer Knowledge API & MCP Server」、Googleが発表
Publickey
Googleは、Google Cloud、Android、FirebaseなどGoogleテクノロジーの公式ドキュメントの情報を取得し、生成AIから参照できるDeveloper Knowledge APIおよびそれに対応したMCP(Mode...
5日前

クラウドインフラのシェア、AWSがトップを維持するも28%、AzureとGoogle Cloudが少しずつ差を詰めていく。2025年第4四半期、Synergy Researchの調査結果
Publickey
調査会社のSynergy Research Groupは、グローバルにおける2025年第4四半期のクラウドインフラの市場状況について調査結果を発表しました。 クラウドインフラとは、IaaS、PaaS、ホステッドプライベートクラウドを合わせた...
5日前
2/16 (月)

コーディングエージェントがブレなくコードを生成できるプロンプトが大切
きしだのHatena
コーディングエージェントはもはや当たり前になってきています。エージェントにコードを作らせるとき、ブレなくコードを生成できるプロンプトを作るのが大事です。 ここでプロンプトには、AGENT.mdなどのファイルも含みます。 コンテキストに乗るもの全てなので、実際にはコンテキストをちゃんと健全に保つことが大事ということになるのですが、入力プロンプトが中でも重要なのでここではプロンプトとしておきます。 最初に与える設計などの情報をちゃんと作るのはもちろんのこと、途中の指示も「この機能いれて」「やっぱこうしよう」「ここは不要だった」のように機能を入れたり削ったり変えたりしていると、エージェントだけではな…
5日前

Git submoduleを使ってマルチリポジトリなMonorepoを管理する LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2023年2月20日)を、現在のブログへ移管したものです。内容は初出時点のものです。こんにちは、LINEフロントエンド開発センターの玉田です。新春...
6日前

Web フォントを使って contenteditable から脱出する LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2022年1月19日)を、現在のブログへ移管したものです。内容は初出時点のものです。こんにちは、LINE フロントエンド開発センターの玉田です。突...
6日前

SRE Kaigi 2026に参加してきました!
Sansan Tech Blog
こんにちは!Eight Engineering Unit Platformグループで名刺アプリ「Eight」のSREをしている峯岸です。 2026年1月31日に開催されたSRE Kaigi 2026へ初めて参加してきました。SRE Kaigiは日本国内のSREコミュニティーが集まる年次カンファレンスで、多くのSREプラクティスや組織論に関するセッションが行われています。 2026.srekaigi.net Eightでも、SLOの策定・改善や AI活用によるトイル削減など、SREに関する取り組みを進めています。本記事では、特に印象的だったセッションの内容とそこから得られた学び、そしてEight…
6日前

The AI Vampire Simon Willison's Weblog
<p><strong><a href="https://steve-yegge.medium.com/the-ai-vampire-eda6e4f07163">The AI Vampire</a></strong></p>Steve Yegge's take on agent fatigue, and its relationship to burnout.</p><blockquote><p>Let's pretend you're the only person at your company using AI.</p><p>In Scenario A, you decide you're going to impress your employer, and work for 8 hours a day at 10x productivity. You knock it out of the park and make everyone else ...
6日前

Claude Codeエージェント実践 Day 16|n8nワークフローエージェントを設計する
Akiraさんのフィード
TL;DRDay 15 で設計した4体のエージェントチームのうち、2体目の n8nワークフローエージェント を部下育成モデル Phase 1(設計する)で構築したn8n エージェントの役割は 翻訳者 — データ分析エージェントが確定した SQL を、n8n ワークフロー JSON に変換する。SQL の中身には触らせないn8n の MCP 連携を有効にし、Claude Code から /run-workflow /list-workflows でワークフローを操作できるスキルを設計した 作ったものn8nワークフローエージェントの初期構成n8n-workflow-a...
6日前

Em dash Simon Willison's Weblog
<p>I'm occasionally accused of using LLMs to write the content on my blog. I don't do that, and I don't think my writing has much of an LLM smell to it... with one notable exception:</p><pre> <span class="pl-c"># Finally, do em dashes</span> <span class="pl-s1">s</span> <span class="pl-c1">=</span> <span class="pl-s1">s</span>.<span class="pl-c1">replace</span>(<span class="pl-s">' - '</span>, <span cla...
6日前

Deep Blue Simon Willison's Weblog
<p>We coined a new term on the <a href="https://simonwillison.net/2026/Jan/8/llm-predictions-for-2026/">Oxide and Friends podcast</a> last month (primary credit to Adam Leventhal) covering the sense of psychological ennui leading into existential dread that many software developers are feeling thanks to the encroachment of generative AI into their field of work.</p><p>We're calling it <strong>Deep Blue</strong>.</p><p>You can listen to it be...
6日前

Gwtar: a static efficient single-file HTML format Simon Willison's Weblog
<p><strong><a href="https://gwern.net/gwtar">Gwtar: a static efficient single-file HTML format</a></strong></p>Fascinating new project from Gwern Branwen and Said Achmiz that targets the challenge of combining large numbers of assets into a single archived HTML file without that file being inconvenient to view in a browser.</p><p>The key trick it uses is to fire <a href="https://developer.mozilla.org/en-US/docs/Web/API/Window/stop">window.st...
6日前

Three months of OpenClaw Simon Willison's Weblog
<p>It's wild that the first commit to OpenClaw was <a href="https://github.com/openclaw/openclaw/commit/f6dd362d39b8e30bd79ef7560aab9575712ccc11">on November 25th 2025</a>, and less than three months later it's hit 10,000 commits from 600 contributors, attracted 196,000 GitHub stars and sort-of been featured in an extremely vague <a href="https://www.youtube.com/watch?v=n7I-D4YXbzg">Super Bowl commercial for AI.com</a>.</p><p>Quoting AI.com founder <...
6日前

オープンソースの公式サポート終了後も、最小限のコストで安全に脆弱性対応を可能にする「TuxCare ELS」提供開始[PR]
Publickey
OSやプログラミング言語のランタイムのアップデートは、プログラマやシステム運用者にとって常に悩みのタネだといえます。 一般に、数年ごとに発生するOSや言語のランタイム、ライブラリなどのメジャーアップデートのサイクルと比べて、アプリケーション...
6日前

GitHub、YAMLではなく自然言語でビルドやデプロイなどのワークフローを記述できる「GitHub Agentic Workflows」テクニカルプレビュー
Publickey
GitHubは、自然言語でGitHub Actionsワークフローを記述できる「GitHub Agentic Workflows」のテクニカルプレビューを発表しました。 Imagine waking up to calm... Issue...
6日前
2/15 (日)

Quoting Eric Meyer Simon Willison's Weblog
<blockquote cite="https://mastodon.social/@Meyerweb/116065151451468199"><p>I saw yet another “CSS is a massively bloated mess” whine and I’m like. My dude. My brother in Chromium. It is trying as hard as it can to express the totality of visual presentation and layout design and typography and animation and digital interactivity and a few other things in a human-readable text format. It’s not bloated, it’s fantastically ambitious. Its reach is greater than most of us can hope to gra...
6日前

How Generative and Agentic AI Shift Concern from Technical Debt to Cognitive Debt Simon Willison's Weblog
<p><strong><a href="https://margaretstorey.com/blog/2026/02/09/cognitive-debt/">How Generative and Agentic AI Shift Concern from Technical Debt to Cognitive Debt</a></strong></p>This piece by Margaret-Anne Storey is the best explanation of the term <strong>cognitive debt</strong> I've seen so far.</p><blockquote><p><em>Cognitive debt</em>, a term gaining <a href="https://www.media.mit.edu/publications/your-brain-on...
6日前

Claude Codeエージェント実践 Day 15|エージェントモデリング — 共通スキル × 固有スキルで専門家チームを設計する
Akiraさんのフィード
TL;DRWeek 2 で「1エージェント × 1スキル」を育てた。Week 3 では「複数エージェント × パイプライン」に拡大する「何をエージェント化すべきか」「どう分割すべきか」を判断するエージェントモデリングの手法を整理した共通スキル(BigQuery)× 固有スキル(n8n / Dataflow / Python出力) のコンポジションで、4体のエージェントチームを設計した 作ったものWeek 3 のエージェントチーム設計エージェント共通スキル固有スキル役割データ分析エージェントBigQuery-探索的にデータを分析する...
7日前










