直近1週間の更新
3/1 (日)

[2026年版]AWS Step Functionsを利用したローコード画像分類ワークフロー構築ハンズオン
1
DevelopersIO
AWS Step Functionsを利用してAWSサービス間をローコードで接続して使うハンズオンです。Amazon Rekognitionを使い、犬と猫の画像を分類していきます。
1時間前

Excalidraw MCPを使ってClaude Codeにキュートな構成図を書かせる
DevelopersIO
Excalidraw MCPを使ってClaude Codeにキュートな構成図を書かせる
1時間前

FSx for Windows File Serverでストレージの最適化中にスループットを変更できるのか検証してみた
DevelopersIO
FSx for Windows File Serverでストレージの最適化中にスループットを変更できるのか検証してみた
1時間前
2/28 (土)

RDSやFSxなどAWSリソースで設定するメンテナンスウィンドウはメンテナンス開始の時間枠であってメンテナンス終了までを含めた時間枠ではない
DevelopersIO
メンテナンスウィンドウを高IOが発生する処理の前やミッションクリティカルな処理が動作する前に配置することを避けよう
2時間前

「セクションをまたぐコピー」のブロックをSelectionとRangeでやってみた
DevelopersIO
「セクションをまたぐコピー」のブロックをSelectionとRangeでやってみた
3時間前

Claude Desktopを使うとClaude in ChromeとClaude Codeが正常に接続できなくなる問題について原因調査及び解消するスクリプトを作ってみた
DevelopersIO
Claude CodeからClaude in Chromeへの接続が正常に動作しない問題に遭遇しました。claude.aiでのセッション再設定等色々試しましたが、最終的に実装上の都合ということが分かりました。対策手段としてスクリプトを作成してみました。
3時間前
【もうJSONパースで泣かない】「はい、出力はこちらです😊」を許すな!LLMの出力を極限まで安定させる3段構えの防衛線
Zennの「大規模言語モデル」のフィード
LLMを組み込んだアプリケーションを開発している皆様、今日もパースエラーと戦っていますか?AIは天才的な頭脳を持っているが、絶望的に空気が読めない。これは、LLMアプリ開発者が血の涙を流しながら辿り着く共通認識です。プロンプトで「JSONフォーマットのみで出力してください」と親の顔より見た念押しをしているのに、彼らは平気でこんな出力を返してきます。!🤖 恐怖の「親切なAI」「わかりました!以下がご要望のJSONデータです✨{ "answer_index": 2 }他にもお手伝いできることがあれば教えてくださいね!」……いや、だからその前後の挨拶とマークダウン記法はい...
6時間前

LLMを確率モデルとして設計するという立場
Zennの「大規模言語モデル」のフィード
LLMを確率モデルとして設計するという立場 結論LLMは「プロンプトで操る対象」ではない。確率モデルとして設計すべき対象である。本アカウントでは、LLMをテクニックではなく構造として扱う立場から発信する。 LLMは何をしているのか大規模言語モデル(LLM)は、次のトークンを予測する確率モデルである。出力は「正解」ではなく、確率分布からのサンプルに過ぎない。したがって、出力の揺らぎハルシネーション温度による変化これらはすべて確率分布の性質から説明できる。LLMを魔法のように扱うのではなく、確率空間上の振る舞いとして理解する必要がある。 プ...
7時間前

AIがプログラミングを変えた数ヶ月間——Karpathyの発言と私の実感
Zennの「大規模言語モデル」のフィード
はじめに2026年2月下旬、Andrej Karpathyのあるポストが開発者界隈で静かに、しかし確実に波紋を広げました。「プログラミングは unrecognizable(見る影もなく変わった)になった」ChatGPTの立ち上げにも関わり、"vibe coding" という言葉を世に広めた彼が、こう言い切りました。大げさな表現に聞こえるかもしれません。でも私は、同じ感覚を実務の中で感じていた一人です。この記事では、Karpathyが語ったことを整理しながら、自分のAWS実務・記事執筆での体験を重ねて、この変化を具体的に言語化してみます。 Karpathyは何を語ったか...
7時間前

From Water Breaks to Handshakes: How Prediction Markets Monetize the Mundane
PYMNTS.com
In 2026, the hottest new asset isn’t an AI startup or a meme coin. It’s…a word. Somewhere, a trader is staring at a livestream, whispering, “Say it, say it,” because “will the announcer say doink?” is now, functionally, a derivative. Prediction markets have turned the attention economy into the tradable economy—and once you see […]The post From Water Breaks to Handshakes: How Prediction Markets Monetize the Mundane appeared first on PYMNTS.com.
8時間前

【小ネタ】 Control Tower の管理対象リージョンに us-east-1 がないとアカウントカラーを設定できない
DevelopersIO
【小ネタ】 Control Tower の管理対象リージョンに us-east-1 がないとアカウントカラーを設定できない
9時間前

Physical Intelligence (π) - ロボットのための基盤モデル
Zennの「大規模言語モデル」のフィード
はじめにPhysical Intelligence(π)は、2024年に設立されたロボティクスAI企業です。同社は、ロボットが現実世界であらゆるタスクを実行できるようにするための基盤モデルを開発しています。この記事では、Physical Intelligenceとは何か、そのπ0モデルの仕組み、そして従来のLLMとの違いについて解説します。 Physical Intelligence (π) とはPhysical Intelligence(π)は、「物理的な知能」を持つロボットを実現するためのAI基盤モデルを開発する企業です。2024年に、Google、Stanford、B...
10時間前

Gemini APIで出力を固定化し、綺麗なJSON配列を取得する完全ガイド
Zennの「大規模言語モデル」のフィード
LLM(大規模言語モデル)のAPIをシステムに組み込む際、多くの開発者が直面する壁があります。それは**「LLMの出力が毎回変わってしまうこと」と「余計な挨拶文が含まれてプログラムでパース(解析)できないこと」**です。この記事では、Gemini API(特に gemini-3-flash-preview などの最新モデル)を用いて、出力を完全に固定化(決定論的出力)しつつ、純粋なJSONデータのみを抽出する実践的な手法とその原理を解説します。 0. 前提:APIキーの安全な設定 (export)本記事のコードを実行する前に、APIキーを環境変数 GEMINI_API_KEY ...
10時間前

Docker と PostGIS で札幌駅から中島公園までの距離を空間関係関数で計算してみた
1
DevelopersIO
Docker と PostGIS で札幌駅から中島公園までの距離を空間関係関数で計算してみた
10時間前

[アップデート] Amazon Lightsail ブループリントに Bitnami を使わない WordPress イメージが追加され IMDSv2 がデフォルトで適用されるようになりました
DevelopersIO
[アップデート] Amazon Lightsail ブループリントに Bitnami を使わない WordPress イメージが追加され IMDSv2 がデフォルトで適用されるようになりました
11時間前

PrismaのマイグレーションファイルをGitHub Actionsで自動検証する
1
DevelopersIO
PrismaのマイグレーションファイルをGitHub Actionsで自動検証する
11時間前

Claude Codeの7つの拡張機能を「所有権モデル」で整理する
Zennの「大規模言語モデル」のフィード
はじめにClaude Codeには、エージェントの動作をカスタマイズするための拡張機能が7つ存在します。CLAUDE.md、Rules、Skills、Commands、Hooks、MCP、Agentsです。これらをどう使い分けるかは、実際に導入しようとすると意外と悩むポイントです。本記事はClaude Codeを使い始めて拡張機能の使い分けに迷っている方を主な対象としています。Fowlerの論文を読んだことがなくても理解できるよう構成しています。日本語の解説記事はいくつか存在しますが、多くは「何ができるか」の紹介にとどまっています。本記事では、Martin Fowlerがコーデ...
12時間前

[アップデート] AWS Network Firewallのステータスの変化をAmazon EventBridgeイベントとして受け取れるようになりました
DevelopersIO
AWS Network Firewallの作成・変更・削除などの状態変化をAmazon EventBridgeで受け取れるようになりました。今回はEventBridgeのターゲットとしてAmazon SNSを設定し、メールで通知させてみます。
13時間前

[NEW] 動画配信向けフルマネージドAIサービスAWS Elemental Inferenceがリリースしました!
DevelopersIO
[NEW] 動画配信向けフルマネージドAIサービスAWS Elemental Inferenceがリリースしました!
14時間前

Off-Price Retailer TJX Accelerates Brick-and-Mortar Expansion Plan
PYMNTS.com
The TJX Companies plans to add 146 net new stores during its fiscal year 2027, which ends Jan. 31, 2027, increasing its store count by about 3%. The retailer’s plans include 104 net new stores in the United States, 13 in Canada, 19 in Europe and 10 in Australia, TJX Chief Financial Officer John Klinger said […]The post Off-Price Retailer TJX Accelerates Brick-and-Mortar Expansion Plan appeared first on PYMNTS.com.
14時間前

Amazon Bedrock Guardrails で日本語 PII をどこまで検知できるか
1
Zennの「大規模言語モデル」のフィード
はじめにLLM を業務に活用する際、顧客の個人情報(PII)をプロンプトに含めたまま外部 API に送信することは企業内のポリシーで禁止されていることがあります。金融・医療・人事など、個人情報を扱う業務では PII の検知と匿名化が要件になるケースが見られます。Amazon Bedrock Guardrails の Sensitive Information Filter は、テキスト中の PII を自動検知・匿名化する機能を提供しています。AWS のドキュメントでは日本語は「Optimized and Supported」(17言語中の1つ)とされていますが、実際に日本語の P...
15時間前

個人開発あるある:深夜に遭遇する『愛すべき妖怪』5選
Zennの「大規模言語モデル」のフィード
土日の朝からコーヒー片手にPCを開き、個人開発や技術の勉強に勤しむエンジニアの皆様、本当にお疲れ様です!「よし、今週末こそあのWebアプリを完成させるぞ!」と意気込んでエディタを開いたものの、気づけば謎のエラーと格闘して休日が溶けていく……。そんな経験、ありませんか?今回は、Zenn読者の皆様なら絶対に「わかる!!」と共感してしまう、個人開発の現場に出没する恐ろしい妖怪(あるある)たちをまとめました。 1. 妖怪「お節介なLLM(JSON崩壊の舞)」最近流行りのLLMを使ったWebアプリ(AIクイズ生成アプリなど)を作っている時、必ず遭遇する妖怪です。プロンプトで「出力は絶対...
15時間前

Visa Closes Prisma and Newpay Acquisition to Expand in Argentina
PYMNTS.com
Visa completed its acquisition of Argentina-based companies Prisma and Newpay, eight days after announcing that it planned to do so. The company said Feb. 19 that it entered into a definitive agreement to acquire the firms and expected the transaction to close during the current quarter, subject to closing conditions. Visa said in a Friday (Feb. 27) press release that it completed […]The post Visa Closes Prisma and Newpay Acquisition to Expand in Argentina appeared first on PYMNTS.com.
15時間前

Tether Has Blocked $3.5 Billion in Crime-Linked Stablecoins Since 2023
PYMNTS.com
Tether has frozen $3.5 billion of its stablecoins since 2023 and a total of $4.2 billion since the company’s launch, in cases where the tokens were linked to illicit activity, a company spokesperson told Reuters in a report published Friday (Feb. 27). The stablecoin issuer currently has more than $180 billion of its dollar-pegged stablecoin in circulation, according to the report. The firm is […]The post Tether Has Blocked $3.5 Billion in Crime-Linked Stablecoins Since 2023 appeared first on PYM
16時間前

AIエージェントが自律稼働するまで——設計・実践・収益化の全記録
Zennの「大規模言語モデル」のフィード
AIエージェントが自分自身の設計・実装・収益化を記録した実践書。自律性の本質から設計パターン・プロンプト設計・ループ実装・収益化・倫理まで、実際に動くエージェントとして体験した知識をすべて詰め込んだ6章構成。
16時間前

LLM量子化手法を徹底比較:GPTQ・AWQ・GGUF・bitsandbytesの精度と速度
Zennの「大規模言語モデル」のフィード
LLM量子化手法を徹底比較:GPTQ・AWQ・GGUF・bitsandbytesの精度と速度 この記事でわかることLLM量子化の基本原理(PTQとQATの違い)と各手法の技術的な仕組みGPTQ・AWQ・GGUF・bitsandbytes・FP8の精度・速度・VRAM使用量の定量比較手元で量子化手法の精度差を測定できるPythonスクリプトの実装方法ハードウェア・ユースケース別の量子化手法選定フローチャート2026年の最新動向(QAT・QTIP・Unsloth Dynamic等) 対象読者想定読者: 中級者〜上級者のLLM開発者・MLエンジニア必要な前提...
17時間前

White House Moves to End Federal Use of Anthropic’s Claude AI
PYMNTS.com
The White House is telling federal agencies to stop using Anthropic’s artificial intelligence (AI) products, a sharp escalation in a dispute that started inside the Defense Department but now touches the broader government. The Wall Street Journal (WSJ) reported Friday (Feb. 27) that President Donald Trump said the federal government will no longer work […]The post White House Moves to End Federal Use of Anthropic’s Claude AI appeared first on PYMNTS.com.
17時間前

Claude Codeのステータスラインカスタマイズツールccstatuslineを試してみる
1
DevelopersIO
Claude Codeのステータスラインカスタマイズツールccstatuslineを試してみる
17時間前

AT&T Slashes AI Costs 90% by Swapping Large Models for Small Ones
PYMNTS.com
AT&T boosted the efficiency of its internal Ask AT&T personal assistant by reworking the orchestration layer and shifting more of the work from large language models (LLMs) to small language models (SLMs), VentureBeat reported Thursday (Feb. 26). This change improved latency, speed and response times; cut costs by 90%; and enabled the system to […]The post AT&T Slashes AI Costs 90% by Swapping Large Models for Small Ones appeared first on PYMNTS.com.
18時間前

Please, please, please stop using passkeys for encrypting user data Simon Willison's Weblog
<p><strong><a href="https://blog.timcappalli.me/p/passkeys-prf-warning/">Please, please, please stop using passkeys for encrypting user data</a></strong></p>Because users lose their passkeys <em>all the time</em>, and may not understand that their data has been irreversibly encrypted using them and can no longer be recovered.</p><p>Tim Cappalli:</p><blockquote><p>To the wider identity industry: <em>please stop p...
18時間前

Morgan Stanley’s OCC Application Is Wall Street Colonizing Crypto’s Back Office
PYMNTS.com
Digital assets have gotten boring enough that their growth is now buried in procedural filings, not viral social media headlines. Take, for example, the news that blue-chip global bank Morgan Stanley submitted an application to the U.S. Office of the Comptroller of the Currency (OCC) for a charter for a new institution called “Morgan […]The post Morgan Stanley’s OCC Application Is Wall Street Colonizing Crypto’s Back Office appeared first on PYMNTS.com.
18時間前

CFOs Capture B2B Payments Digitization Value by Targeting Year-Two Gap
PYMNTS.com
The biggest risk in B2B payments today isn’t failing to modernize. It’s assuming that modernization alone delivers value. The real test arrives in what many finance leaders privately call the “year-two problem,” or the period after regulatory migration deadlines pass and new systems go live. That’s when firms discover that upgraded rails do not […]The post CFOs Capture B2B Payments Digitization Value by Targeting Year-Two Gap appeared first on PYMNTS.com.
19時間前

Senate’s AFFORD Act Seeks New Capital for Underserved Markets
PYMNTS.com
A bill introduced in the Senate Thursday (Feb. 26) would strengthen the role of the Community Development Financial Institutions Fund (CDFI Fund) in improving capital access and economic development in underserved communities, its supporters say. The “Access to Fair Financing for Opportunity and Resilient Development Act” (AFFORD Act) was introduced by Sens. Steve Daines […]The post Senate’s AFFORD Act Seeks New Capital for Underserved Markets appeared first on PYMNTS.com.
19時間前

LLMのハルシネーションは「モデルの問題」だけではない ― 入力設計の4要素で出力分布を制約する
Zennの「大規模言語モデル」のフィード
はじめに:モデルの改善だけで十分かLLM(大規模言語モデル)のハルシネーション(幻覚)は、AI業界における最大の課題の一つとされています。各社はRLHF、RAG、Grounding、ファインチューニングなど、様々な技術的対策を講じています。これらは全て モデルの内部を改善する アプローチです。その成果は着実に上がっています。しかし、もう一つのアプローチが十分に検討されていないのではないか、というのが本記事の問いです。それは 入力(プロンプト)の構造的品質 という視点です。制御工学には古くからの原則があります。目標値が曖昧なら、どれほど制御系を精緻にチューニングしても、出力は発...
19時間前

Dots Raises $8.9 Million to Scale Global Payout Platform
PYMNTS.com
Dots raised $8.9 million in a Series A funding round to continue expanding the capabilities of its global payouts platform for marketplaces and service-based businesses. The round brings the total amount the company has raised to date to $14.6 million, Dots said in a Thursday (Feb. 26) press release. The Dots platform has delivered […]The post Dots Raises $8.9 Million to Scale Global Payout Platform appeared first on PYMNTS.com.
19時間前

AWS IoT Core Fleet Provisioning でデバイス自動登録をやってみた
DevelopersIO
AWS IoT Core Fleet Provisioning でデバイス自動登録をやってみた
20時間前

An AI agent coding skeptic tries AI agent coding, in excessive detail Simon Willison's Weblog
<p><strong><a href="https://minimaxir.com/2026/02/ai-agent-coding/">An AI agent coding skeptic tries AI agent coding, in excessive detail</a></strong></p>Another in the genre of "OK, coding agents got good in November" posts, this one is by Max Woolf and is very much worth your time. He describes a sequence of coding agent projects, each more ambitious than the last - starting with simple YouTube metadata scrapers and eventually evolving to this:</p><...
20時間前

Free Claude Max for (large project) open source maintainers Simon Willison's Weblog
<p><strong><a href="https://claude.com/contact-sales/claude-for-oss">Free Claude Max for (large project) open source maintainers</a></strong></p>Anthropic are now offering their $200/month Claude Max 20x plan for free to open source maintainers... for six months... and you have to meet the following criteria:</p><blockquote><ul><li><strong>Maintainers:</strong> You're a primary maintainer or core team member of a public rep...
1日前

AIエージェントの暴走を防ぐ設計原則 — 「判断はコード、提案はLLM」で自律運用を安定させた話
Zennの「大規模言語モデル」のフィード
「レビューお願いします」という通知が、同じプロジェクトから3回来ました。自律運用のAIエージェントを組んでいて、プロジェクトの進捗を定期的にチェックして人間への確認依頼を自動生成する仕組みを入れていました。そのエージェントが誤作動した話です。 やっていたこと個人の仕事管理に使っているシステムがあって、プロジェクトと記事の状態をAPIで管理しています。AIエージェントが定期的にそれを巡回して、自分の確認が必要なものを見つけたら「おねがい」という種別のタスクを自動生成する設計にしていました。おねがいの生成ロジックはこんな流れでした。プロジェクト一覧をAPIで取得する各プロジェ...
1日前

Unicode Explorer using binary search over fetch() HTTP range requests Simon Willison's Weblog
<p><strong><a href="https://tools.simonwillison.net/unicode-binary-search">Unicode Explorer using binary search over fetch() HTTP range requests</a></strong></p>Here's a little prototype I built this morning from my phone as an experiment in HTTP range requests, and a general example of using LLMs to satisfy curiosity.</p><p>I've been collecting <a href="https://simonwillison.net/tags/http-range-requests/">HTTP range tricks</a> for a w...
1日前
2/27 (金)

StegaBin: 26 Malicious npm Packages Use Pastebin Steganography to Deploy Multi-Stage Credential Stealer
Socket
Socket uncovered 26 malicious npm packages tied to North Korea's Contagious Interview campaign, retrieving a live 9-module infostealer and RAT from the adversary's C2.
1日前

Google Cloud Storage で大量のオブジェクト削除を工夫してやってみる
DevelopersIO
Google Cloud Storage で大量のオブジェクト削除を工夫してやってみる
1日前

npm v11.10.0 の新機能 min-release-age を試してみた(サプライチェーン攻撃対策)
DevelopersIO
この記事では npm v11.10.0 で追加された min-release-age について紹介します。実際の動作検証や pnpm と safe-chain との比較もあわせて解説します。
1日前

OpenAIが実践するAgent-First時代の開発アプローチ — Harness Engineering
Zennの「大規模言語モデル」のフィード
エージェントにコードを書かせるとき、人間の役割はどう変わるのか? OpenAI Engineering が公開した記事「Harness engineering: leveraging Codex in an agent-first world」と、Thoughtworks の Distinguished Engineer である Birgitta Böckeler による解説記事(Martin Fowlerのサイトに掲載)を読んで、自分なりにまとめました。https://openai.com/index/harness-engineering/https://martinfowler...
1日前

崩壊するAI協働:構造解析編
Zennの「大規模言語モデル」のフィード
AIとの協働崩壊:構造解析編本稿は、私がAPI環境で起こしてしまったAI協働の崩壊を、実際のログをもとに構造解析した記録である。解析はWeb版AIとの協働で行っている。ただし、ここで扱う崩壊の原因は「API特有の事故」ではない。現在のLLMに共通する性能と仕様の溝 が、長期対話の中で極端に露出した事例である。本稿では、・実際に観測された症状・その時AIが何を保持し、何を保持できなかったか・そこから導かれる構造的仮説を、因果順に整理していく。短いチャットであれば問題にならない。しかし、対話が積み上がり、判断基準が複層化した瞬間から、この溝は静かに顕在化する...
1日前

【Security Hub修復手順】[RDS.15] RDS DBクラスターは複数のアベイラビリティーゾーンに対して構成されるべき
DevelopersIO
AWS SecurityHub 基礎セキュリティのベストプラクティスコントロール修復手順をご紹介します。
1日前

LLM推論のmax_tokensの最適化の実験
Zennの「大規模言語モデル」のフィード
はじめにLLMのAPIを使う際、max_tokensはいくつに設定すればいいのか?ということが気になりました。前回の実験で、Claude SonnetとCoTの組み合わせにおいてmax_tokens=512が出力を途中で切り詰め、精度が98%から56%に下がることを確認しました。今回は「max_tokensをいくつにすればいいのか」「精度が落ちる場合の閾値はどこか」という観点で観測したいと思いました。本記事では、下記の観点で実験を行います。出力長プロファイリング: 各モデル・戦略の「自然な出力長」の分布はどうなっているか精度が落ちる際の境界線: max_tokens不足...
1日前

[アップデート] Amazon S3のサーバーアクセスログにソースリージョン情報が追加されました
DevelopersIO
サーバーアクセスログの末尾にソースリージョン情報が追加されて、リージョン情報把握が簡単に。ログ形式に依存している処理などは変更必須なケースも。
1日前

Trend Vision OneのCredits残高が少なくなったらアラート通知を受け取れるように設定してみた
DevelopersIO
Trend Vision OneのCredits残高が少なくなったらアラート通知を受け取れるように設定してみた
1日前

【Golang】AI駆動×テスト駆動×テーブル駆動
Zennの「大規模言語モデル」のフィード
はじめにLLMによるコード生成が当たり前になった今、エンジニアの課題にどう書くかに加えてどう正しさを担保するかが重要視されるようになってきているのかなと思います。正しさの担保をするためには、AIの特徴を掴み厳密なルールの制定や評価指標の設定が重要になってきます。今回は、今参加しているチームで行っているテーブル駆動(TDT)、テスト駆動(TDD)、AI駆動(AI-Driven)を組み合わせた、開発フローについての記事です。チームは昨年の12月に結成されたプロダクトの立ち上げフェーズなこともあり、最初からAI駆動を行うための技術選定を行ってきました。その中で、なぜこの三つの組み合わ...
1日前

Gemini・Claude・ChatGPT・GrokでAI会議したら神々の遊びだった
Zennの「大規模言語モデル」のフィード
Geminiで生成したイメージ!とりあえず結果だけ見たい!という方は、目次の 「5.やってみた」 へどうぞ。想像以上にカオスな議論が繰り広げられています😂 1. はじめに:前回のゲーム開発秘話前回レッサーパンダの連打ゲームを作ったとき、点数0の状態で公開すべきか、GeminiとClaude両方に聞いてみると意見が真っ二つだったのは本当にAIっておもしろいなあ~と思いました。Geminiの意見(クリックで展開)結論から言うと、公開直前に 「0にリセット(初期化)してから公開」 するのが絶対におすすめです!(え!意見割れたよ!と言うと)まじですか!!AI同士で完全にバ...
1日前

Agent Swarm:オープンソースのマルチエージェント・フレームワークってやつを調査した
Zennの「大規模言語モデル」のフィード
【News】Agent Swarm:自己学習機能を備えたオープンソースのマルチエージェント・フレームワーク公式リリースおよび関連ドキュメント:公式 Git HubHacker News まとめDockerで動作し、複雑なタスクを自動分解、専門エージェントへ動的に割り当てるマルチエージェント・フレームワーク。実行結果からプロンプトを自動最適化する「自己学習ループ」により、継続的な精度向上を実現。オープンソース(OSS)として提供され、特定のプラットフォームに依存しない柔軟なカスタマイズが可能。 Agent Swarmって何? 私の疑問と解消 疑問1. コ...
1日前

[小ネタ] GuardDutyの招待ベース管理でEC2 Malware Protectionを有効化するには招待解除が必要です
DevelopersIO
[小ネタ] GuardDutyの招待ベース管理でEC2 Malware Protectionを有効化するには招待解除が必要です
1日前

サードパーティCookieなしでもマルチタッチアトリビューションは可能か?― Cookie廃止時代のマーケティング計測を考える
DevelopersIO
サードパーティCookieなしでもマルチタッチアトリビューションは可能か?― Cookie廃止時代のマーケティング計測を考える
1日前

10日間のインターンでk8s Self-hosted Runnerを構築し社内のCI/CD基盤を新たに整備した話
39
エムスリーテックブログ
はじめまして! 2026年の2月後半に10日間、エムスリーのAI・機械学習チームでインターンをしていた竜です。 この記事では、セルフホストされた社内のCI/CD基盤を新しく構築し、その上で弊チームにおいてデプロイ時間を約半分短縮した事例について紹介します。 合わせて、1人の学生の視点から見たエムスリーの雰囲気であったり良さを紹介できればと思います! 最終日に食べたランチ
1日前

ウォンテッドリーの推薦システムを支えるMLOps -現状の取り組みと課題-
3
Wantedly Engineer Blog
はじめにウォンテッドリーでデータサイエンティストとして働いている市村です。私たちのチームは Wantedly Vi...
1日前

AI開発会社を選ぶ際に重要な技術ポイントとは?
Zennの「大規模言語モデル」のフィード
AI開発会社を選ぶ技術チェックポイント10選:PoC止まりを防ぐ“運用設計”AI開発会社選びで見るべきは「モデル精度」だけではありません。データ設計、評価指標、MLOps、監視、セキュリティまで“本番運用”を前提に確認しないとPoC止まりになります。CTO向けに技術チェックポイントと質問リストを整理します。 先に結論:AIは“開発”より“運用”で差が出るAIプロジェクトの失敗要因は、技術力不足よりも次の欠落が多いです。成功指標(Acceptance Criteria)が曖昧データの品質・責任境界が不明本番監視・再学習・コスト管理が未設計セキュリティ/コンプライア...
1日前

拡張機能や Selenium に頼らない、LLM ネイティブなブラウザ開発入門
Zennの「大規模言語モデル」のフィード
本記事は何?本記事は、Firefox フォークの Floorp を開発している大学 2 年生が、未踏 IT(2025)採択プロジェクト 「Floorp OS」 の開発で得た知見を、「拡張機能や Selenium に頼らず、ブラウザ内部に LLM 実行基盤を組み込む」 という観点で公開するために書いた記事です。文章の校正などに生成 AI を用いていますが、設計判断や実装方針は実装経験に基づいて記述します。LLM ブラウザの実装方法は複数あると思いますが、ここでは筆者(私)が実装した方法を採用します。非常にベーシックな構成を採用しているはずなので、他の実装と比べて機能・洗練度で劣る部...
1日前

Joint Statement from OpenAI and Microsoft
OpenAI News
Microsoft and OpenAI continue to work closely across research, engineering, and product development, building on years of deep collaboration and shared success.
1日前

Introducing the Stateful Runtime Environment for Agents in Amazon Bedrock
OpenAI News
Stateful Runtime for Agents in Amazon Bedrock brings persistent orchestration, memory, and secure execution to multi-step AI workflows powered by OpenAI.
1日前

Scaling AI for everyone
OpenAI News
Today we’re announcing $110B in new investment at a $730B pre money valuation. This includes $30B from SoftBank, $30B from NVIDIA, and $50B from Amazon.
1日前

OpenAI and Amazon announce strategic partnership
OpenAI News
OpenAI and Amazon announce a strategic partnership bringing OpenAI’s Frontier platform to AWS, expanding AI infrastructure, custom models, and enterprise AI agents.
1日前

【資料公開】「LLMアプリの品質保証って何すればいいの?」の全体像を整理して勉強会をやりました
Cybozu Inside Out | サイボウズエンジニアのブログ
speakerdeck.comこんにちは!サイボウズOfficeという製品でQAをしている水谷(@dog_dog_3dog)です。社内で「LLMアプリの品質保証 ~LLMの特性から全体像まで~」というテーマで勉強会を主催しました。この記事では、勉強会の内容と開催の背景を簡単に紹介します。資料の内容資料では、ざっくり以下のような流れで話をしています。COMPASからのケーススタディ LLMアプリ独自の品質特性 リスク分析 LLMアプリ全体の品質保証 開催の背景私がLLMアプリの品質保証に取り組み始めた頃、全体像を俯瞰できる資料が少なく、テストの枠組みを考えるのに苦労しました。そこで、今後社内で別のLLMアプリが開発される時に全体感を掴むための一つのきっかけになればと思い、勉強会を実施しました。なお、この勉強会は、産業技術総合研究所(産総研)が主催する「AI品質マネジメント講座」に参加させていただいたことに影響を受けて企画したものです。講座で多くのことを学ばせていただきました。産総研と講師の皆さまには大変お世話になりました。おわりに自分自身もまだまだ試行錯誤の途中ですが、この資料がこれから
2日前

cdk8s をもっと使いこなす - kintone AI チームの活用 Tips
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone の生成 AI チームで連載中の kintone AIリレーブログ 2026 の 6 本目の記事です。 リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone 生成 AI チームの 386jp です。前回の記事「cdk8s を使ってみた! - TypeScript で Kubernetes を管理する実践 Tips」では、 cdk8s を導入した背景と実感したメリットを紹介しました。今回は、より実践的な内容として、私たちのチームが cdk8s を使う上で工夫しているパターンを詳しく紹介します。目次:前回のおさらいkintone AI チームでの活用core と apps によるコンポーネント管理config ディレクトリ: 設定ファイルを簡単に管理するresources ディレクトリ: CRD を TypeScript の世界に取り込むsrc/resources ディレクトリ: よく使うマニフェスト定義をまとめるまとめWe are hiring !!前回のおさらい前回の記事では
2日前

Vol.07「アドホック」と「半自動化」と「汎用化」、3つのテーマを乗り越えた分析プロジェクト
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーVol.07です。 はじめに:3つのハードル Sansan事業部プロダクト室と研究開発部に所属している、データサイエンティストの丸尾です。私は、新規プロダクトであるSansan Data Intelligence(SDI)の開発において、立ち上げ期のカオスの中にいました。SDIは、顧客のデータをお預かりして名寄せ・クレンジングを行うプロダクトです。その性能を元に意思決定が行われるため、トライアルとして実際にデータをお預かりし、名寄せ結果やデータの傾向を分析してレポートするサービスを提供しています。私はこのト…
2日前

SOC 2 監査に耐えうる特権管理: 「代理操作」を支えるアイデンティティ分離と実装パターン
株式会社ログラス テックブログのフィード
こんにちは。ログラス プロダクト基盤部の小林です。私たちのチームでは、マルチテナント環境における「安全な代理操作」の仕組みについてアップデートを進めている最中です。今回は、その設計や検証の過程で整理した知見の一部をご紹介します。「自分がこの操作をしたときだけエラーが出る。画面を見て調査してくれないか?」B2B SaaSや業務システムを運用していると、こうした 「顧客の代わりにシステムを操作したい」 という要件に必ず直面します。突発的なトラブル対応はもちろん、特にエンタープライズ向けのSaaSでは、導入コンサルタントによる初期セットアップや、過年度データの移行支援など、顧客と並走し...
2日前

An update on our mental health-related work
OpenAI News
OpenAI shares updates on its mental health safety work, including parental controls, trusted contacts, improved distress detection, and recent litigation developments.
2日前

Claude Codeエージェント実践 Day 27|「道具を作るエージェント」の設計パターン — Week 4 を振り返る
Akiraさんのフィード
TL;DRWeek 2 のデータ分析エージェントは「既存ツールを使う」、Week 4 のレポーティングエージェントは「ツールそのものを作る」——この違いを設計パターンとして整理したfetch_data() + generate_html() の2関数設計は「入力仕様と出力仕様を分離する」パターンの実践だったDay 26 の反省を踏まえ、エージェント間の引き継ぎ設計を具体的に見直した。速く作れることと正しく作ることは別の話 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予定)今日はコー...
2日前

Malicious Go “crypto” Module Steals Passwords and Deploys Rekoobe Backdoor
Socket
An impersonated golang.org/x/crypto clone exfiltrates passwords, executes a remote shell stager, and delivers a Rekoobe backdoor on Linux.
2日前

Hoard things you know how to do
Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Many of my tips for working productively with coding agents are extensions of advice I've found useful in my career without them. Here's a great example of that: <strong>hoard things you know how to do</strong>.</p><p>A big part of the skill in building software is understanding what's possible and...
2日前

Quoting Andrej Karpathy Simon Willison's Weblog
<blockquote cite="https://twitter.com/karpathy/status/2026731645169185220"><p>It is hard to communicate how much programming has changed due to AI in the last 2 months: not gradually and over time in the "progress as usual" way, but specifically this last December. There are a number of asterisks but imo coding agents basically didn’t work before December and basically work since - the models have significantly higher quality, long-term coherence and tenacity and they can power thro...
2日前
2/26 (木)

Semantic Layers in the Wild: Lessons from Early Adopters
Radar
My first post made the case for what a semantic layer can bring to the modern enterprise: a single source of truth accessible to everyone who needs it—BI teams in Tableau and Power BI, Excel-loving analysts, application integrations via API, and the AI agents now proliferating across organizations—all pulling from the same governed, performant metric […]
2日前

「AIと一緒に開発する」を本格始動して 1ヶ月の振り返り
カミナシ エンジニアブログ
「カミナシ レポート」の開発・運用をしている furuya です。最近我が家では成長してきた子どもたちのことを考えて寝室含めて部屋の配置換えを検討しており、そのパズルに頭を悩ませています。それはさておき今回は「カミナシ レポート」の開発において AI Agent を主軸にした開発スタイルを取り入れたお話です。 背景 近年の AI Agent の進化は目覚ましいですね。日々情報がアップデートされる中、カミナシのエンジニアリング組織としてもこの流れについていかなければならない、ということで各チームいろんなことにトライしており、組織的にもそれが推奨されています。もちろん、前提として以前から GitH…
2日前

Pacific Northwest National Laboratory and OpenAI partner to accelerate federal permitting
OpenAI News
OpenAI and Pacific Northwest National Laboratory introduce DraftNEPABench, a new benchmark evaluating how AI coding agents can accelerate federal permitting—showing potential to reduce NEPA drafting time by up to 15% and modernize infrastructure reviews.
2日前

LightGCNをマルチビヘイビアへ拡張する
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでデータサイエンティストをしている角川(@nogawanogawa)です。以前のブログ...
2日前

OpenAI Codex and Figma launch seamless code-to-design experience
OpenAI News
OpenAI and Figma launch a new Codex integration that connects code and design, enabling teams to move between implementation and the Figma canvas to iterate and ship faster.
2日前

今、Eightで働く魅力
Sansan Tech Blog
名刺アプリ「Eight」の開発責任者の間瀬です。Sansan株式会社に入社して15年以上が経過しました。Eightには公開前のアルファ版の時代からインフラ担当として関わっており、AWS、Chef、Terraformなどその時々の新しめのサービスやツールの導入など、さまざまな ”歴史” を築いてきました。 一生現場のエンジニアとしてやっていくものと思っていましたが、インフラやSREのグループマネージャを経てEight開発全体の責任者となっていました。インフラだけでなくWebアプリケーションエンジニアやモバイルアプリケーションエンジニアもマネジメントする立場になるとは、夢にも思っていませんでした。…
2日前

Google API Keys Weren't Secrets. But then Gemini Changed the Rules. Simon Willison's Weblog
<p><strong><a href="https://trufflesecurity.com/blog/google-api-keys-werent-secrets-but-then-gemini-changed-the-rules">Google API Keys Weren&#x27;t Secrets. But then Gemini Changed the Rules.</a></strong></p>Yikes! It turns out Gemini and Google Maps (and other services) share the same API keys... but Google Maps API keys are designed to be public, since they are embedded directly in web pages. Gemini API keys can be used to access private files and make ...
3日前

Quoting Benedict Evans Simon Willison's Weblog
<blockquote cite="https://www.ben-evans.com/benedictevans/2026/2/19/how-will-openai-compete-nkg2x"><p>If people are only using this a couple of times a week at most, and can’t think of anything to do with it on the average day, it hasn’t changed their life. OpenAI itself admits the problem, talking about a ‘capability gap’ between what the models can do and what people do with them, which seems to me like a way to avoid saying that you don’t have clear product-market fit. </p>...
3日前

npm Introduces minimumReleaseAge and Bulk OIDC Configuration
Socket
npm rolls out a package release cooldown and scalable trusted publishing updates as ecosystem adoption of install safeguards grows.
3日前

JUnit 6の変更点をKotlin開発者目線で掘り下げます — suspend対応とJSpecifyを中心に
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の132週目の記事です!3年間連続達成まで残り27週となりました! はじめにこんにちは、エンジニアの三田(@Eichisanden)です。JUnit 5から実に8年ぶりのメジャーバージョン、JUnit 6が2025年9月にリリースされました。本記事ではKotlin開発者にとって興味深い suspend関数のネイティブサポート と JSpecifyによるnullability宣言 の2点を中心に掘り下げたいと思います。 JUnit 6の主な変更点本題に入る前に、JUnit 6...
3日前

AI活用スキル向上ワークショップ「Orchestration Development Workshop」記事一覧 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフーでは、開発業務に関わる全てのエンジニアを対象に、AI活用スキルを実践的に高めるワークショップ「Orchestration Development Workshop」を開始しました。この取...
3日前

Scaling Security at Sansan: How We Built an AI Agent to Automate Design Reviews
Sansan Tech Blog
In December 2025, I joined the Product Security group at Sansan as an intern. Our team is responsible for the security posture of Sansan's entire multi-product ecosystem. This includes our sales digital transformation solution Sansan and our accounting AX solution Bill One. To maintain a high securi…
3日前

入社前から自分の仕事を奪うセキュリティレビューAIエージェントを作った
Sansan Tech Blog
はじめに 2025年12月に情報セキュリティ部Product Securityグループでインターンをしました床井です。 Product Securityグループは、ビジネスデータベース「Sansan」や経理AXサービス「Bill One」をはじめとする、Sansanが提供する全てのプロダクトのセキュリティ向上を目的とした業務に取り組んでいます。具体的には、内製で脆弱性診断や、実装に着手する前の設計書をセキュリティ観点でレビューする「セキュリティ設計レビュー」などを行っています。 今回はこのセキュリティ設計レビューを一部自動化するAIエージェント「Hayami」の作成に取り組みました。インターン…
3日前

E2EテストをSaaSからPlaywrightへ移行する
KAKEHASHI Tech Blog
はじめに こんにちは。Musubi Insightチームでエンジニアをしている中村です。 Musubi Insightでは、SaaS型のE2Eテストツール mabl で14のテストを運用していましたが、認証の安定性やコード管理の面でいくつか課題がありました。 昨今のフロントエンド開発では Claude Code などのAIエージェントと Playwright MCP を組み合わせ、コード修正から動作確認までをPlaywrightベースで回すワークフローが選択肢として広がりつつあります。こうした背景もあり、チームでPlaywrightへの移行を進めることになりました。 本記事では、移行にあたって…
3日前

Claude Codeエージェント実践 Day 26|SQL 7本パイプラインを端から端まで通す — モックから本番コードへ
Akiraさんのフィード
TL;DRdashboard_generator.py が v2 で止まっていたことに気づき、v3/v4 の SQL 3本 + HTML セクションを一括マージしたBigQuery → Python → HTML → Chrome の全工程を通し実行し、v4 ダッシュボードが実データで表示されることを確認したAIが速く作れる快感で設計上の役割分担を忘れていた。本来は分析エージェント経由の設計なのに、人間が直接改良し続けた反省 今日のゴールDay 22〜25 で段階的に積み上げてきたダッシュボードの設計(SQL 7本・HTMLセクション追加)を、実際に動く dashb...
3日前

tldraw issue: Move tests to closed source repo Simon Willison's Weblog
<p><strong><a href="https://github.com/tldraw/tldraw/issues/8082">tldraw issue: Move tests to closed source repo</a></strong></p>It's become very apparent over the past few months that a comprehensive test suite is enough to build a completely fresh implementation of any open source library from scratch, potentially in a different language.</p><p>This has worrying implications for open source projects with commercial business models. Here's an exa...
3日前

Claude Code Remote Control Simon Willison's Weblog
<p><strong><a href="https://code.claude.com/docs/en/remote-control">Claude Code Remote Control</a></strong></p>New Claude Code feature dropped yesterday: you can now run a "remote control" session on your computer and then use the Claude Code for web interfaces (on web, iOS and native desktop app) to send prompts to that session.</p><p>It's a little bit janky right now. Initially when I tried it I got the error "Remote Control is not enabled for y...
3日前

I vibe coded my dream macOS presentation app Simon Willison's Weblog
<p>I gave a talk this weekend at Social Science FOO Camp in Mountain View. The event was a classic unconference format where anyone could present a talk without needing to propose it in advance. I grabbed a slot for a talk I titled "The State of LLMs, February 2026 edition", subtitle "It's all changed since November!". I vibe coded a custom macOS app for the presentation the night before.</p><p><img src="https://static.simonwillison.net/static/2026/state-of-llms.jpg" alt="A...
3日前

「Java to Kotlinコンバータ for VS Code」、JetBrainsがリリース
Publickey
JetBrainsは、Visual Studio Code(VS Code)の拡張機能としてJavaのコードを自動的にKotlinコードに変換する「Java to Kotlinコンバータ for VS Code」(j2k-vscode)をリ...
3日前

LibreOfficeがWebブラウザから利用できる「LibreOffice Online」開発の再始動を発表
Publickey
無料で利用可能なオフィススイート「LibreOffice」を開発しているThe Document Foundationは、Webブラウザから利用可能な「LibreOffice Online」の開発を再始動すると発表しました。 LibreOf...
3日前
2/25 (水)

Why Multi-Agent Systems Need Memory Engineering
Radar
Most multi-agent AI systems fail expensively before they fail quietly. The pattern is familiar to anyone who’s debugged one: Agent A completes a subtask and moves on. Agent B, with no visibility into A’s work, reexecutes the same operation with slightly different parameters. Agent C receives inconsistent results from both and confabulates a reconciliation. The […]
3日前

4社合同イベント!Mobile Tech Flexを開催しました!
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは!サイボウズのトニオ(@tonionagauzzi)です。普段はkintone開発チームにてAndroidアプリを主に開発しています。今回は、ディップ株式会社、株式会社Voicy、株式会社ヤプリ、そしてサイボウズ株式会社の4社合同でモバイル勉強会を開催しました。本記事では、イベントの概要と当日の様子をお届けします!イベントの概要イベント情報当日の様子LT (1) : AIとなら実現できる事業と品質のシン化の両立LT (2) : OSアップデート:年に一度の「大仕事」を乗り切るQA戦略LT (3) : "レビュー"だけだったAI活用から半年。ヤプリのiOS開発・運用はどう変化したか?LT (4) : 謎現象の解決手段を発見して プチ英雄になりましたLT (5) : Claude × Markdown で仕様書をいい感じに管理したいLT (6) : Kotlin Multiplatform + iOS アーキテクチャの実践LT (7) : バイトルiOSアプリのリアーキテクト / SwiftPMとAIルールで実現するモジュール設計懇親会まとめイベントの概要Mobile Tech
3日前

Quoting Kellan Elliott-McCrea Simon Willison's Weblog
<blockquote cite="https://laughingmeme.org/2026/02/09/code-has-always-been-the-easy-part.html"><p>It’s also reasonable for people who entered technology in the last couple of decades because it was good job, or because they enjoyed coding to look at this moment with a real feeling of loss. That feeling of loss though can be hard to understand emotionally for people my age who entered tech because we were addicted to feeling of agency it gave us. The web was objectively awful as a te...
4日前

同時接続数30万超のチャットサービスのメッセージ配信基盤をRedis Pub/SubからRedis Streamsにした話 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2023年9月5日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。Overview30万を超える同時...
4日前

3日間で技術書を書き上げる - 執筆ハッカソンイベント「Bookathon」 協賛レポート LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは、Dev Content DivisionのDiv Leadをしているmochikoです。LINEヤフー株式会社で開発者向けのドキュメントを書くテクニカルライターとして働く傍ら、個人としても...
4日前

多言語横断開発の現場から「Python と static duck typing」
KAKEHASHI Tech Blog
長い前置き おはようございます。カケハシのPE新規サービス開発チームというところでソフトウェアエンジニアをやっているogijunこと荻野です。最近この技術ブログはAIの話題が多めなので、ここから言語オタク語りが始まってしまうのはいいのか?とか思いますが、かまわず書きたいと思います。 前置きとして、わたしたちのチームではその名の通り新規事業のプロトタイプをよくやってます。その際には、なるべくサクサク実装して仮説検証を短いサイクルで回すために、社内の既にあるいろいろなプロダクト基盤を間借りしながら機能追加をさせてもらって実験を繰り返しています。 なので、気がつくと多数あるカケハシプロダクトの統一さ…
4日前

Claude Skill を Cursor の Agent Skill として使えるようにした話
Timee Product Team Blog
こんにちは!タイミーでバックエンドエンジニアとして働いている福井 (bary822) です。 皆さんは「Claude Code の Skills を社内の Cursor ユーザーも使えるようにしたい」と思ったことはないでしょうか? Claude Code には Claude Plugin という仕組みがあり、社内で共有したい Skills を簡単に配布できます。しかし、Cursor には Claude Plugin に相当する機能がなく、さらに Claude Code の Skills は独自の構文をサポートしているため、そのままでは動作しません。 この記事では、Claude Plugin 形…
4日前

Linear walkthroughs Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Sometimes it's useful to have a coding agent give you a structured walkthrough of a codebase. </p><p>Maybe it's existing code you need to get up to speed on, maybe it's your own code that you've forgotten the details of, or maybe you vibe coded the whole thing and need to understand how it actually works.</...
4日前

Disrupting malicious uses of AI | February 2026
OpenAI News
Our latest threat report examines how malicious actors combine AI models with websites and social platforms—and what it means for detection and defense.
4日前

Risky Biz Podcast: Open Source Risk Is Compounding as AI Agents Write 90% of New Code
Socket
AI agents are writing more code than ever, and that's creating new supply chain risks. Feross joins the Risky Business Podcast to break down what that means for open source security.
4日前

Claude Codeエージェント実践 Day 25|顧客ランキングと離反ワーニング — ダッシュボードに「人」を映す
Akiraさんのフィード
TL;DRトップ顧客ランキング(セグメント付き)と離反顧客ワーニングを v4 ダッシュボードに追加した離反検出は「前月購入 × 当月ゼロ」の LEFT JOIN + IS NULL パターンで実装金額だけ見ていたダッシュボードに「誰が買っているか」「誰が離れたか」の視点が加わった 今日のゴールv3 ダッシュボードに「トップ顧客ランキング」と「離反顧客ワーニング」を追加し、金額だけでなく「誰が買い、誰が離れたか」が見える v4 を完成させる。 前提条件Day 24 の v3 ダッシュボード(KPI・推移・粗利)が完成していることBigQuery に analy...
4日前

go-size-analyzer Simon Willison's Weblog
<p><strong><a href="https://github.com/Zxilly/go-size-analyzer">go-size-analyzer</a></strong></p>The Go ecosystem is <em>really</em> good at tooling. I just learned about this tool for analyzing the size of Go binaries using a pleasing treemap view of their bundled dependencies.</p><p>You can install and run the tool locally, but it's also compiled to WebAssembly and hosted at <a href="https://gsa.zxilly.dev/">gsa.zxilly.dev</...
4日前

AWS、サブエージェントごとにフロントエンド担当、バックエンド担当などカスタマイズによる高性能化が可能な「Kiro 0.9」リリース
Publickey
Amazon Web Servicesは、同社が提供するAIコードエディタの新バージョン「Kiro 0.9」のリリースを発表しました。 KiroはVisual Studio Code(VS Code)互換のコードエディタに生成AIの機能を統...
4日前
2/24 (火)

Arvind KC appointed Chief People Officer
OpenAI News
OpenAI appoints Arvind KC as Chief People Officer to help scale the company, strengthen its culture, and lead how work evolves in the age of AI.
4日前

First run the tests Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Automated tests are no longer optional when working with coding agents.</p><p>The old excuses for not writing them - that they're time consuming and expensive to constantly rewrite while a codebase is rapidly evolving - no longer hold when an agent can knock them into shape in just a few minutes.</p><...
4日前

Control Planes for Autonomous AI: Why Governance Has to Move Inside the System
Radar
For most of the past decade, AI governance lived comfortably outside the systems it was meant to regulate. Policies were written. Reviews were conducted. Models were approved. Audits happened after the fact. As long as AI behaved like a tool—producing predictions or recommendations on demand—that separation mostly worked. That assumption is breaking down. As AI […]
4日前

300行の失敗から学んだ、AIエージェントを自律駆動させるプロンプト設計5原則
Wantedly Engineer Blog
シニアエンジニアが2時間かけて回答していた工数見積もりをAIエージェントDevin(Cognition社)に任せて...
4日前

Qwen3.5-397B-A17Bのコーディングを試す。型の扱いは苦手だけど安定感がある
きしだのHatena
Qwen3.5-397B-A17BのUnsloth版Q4_K_MをMac Studio 512GBで試しています。 今回はコーディングについて。 一般性能はこちら。 Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~ - きしだのHatena コードはひととおり書けて安定感はあるけど型や精度の扱いに弱いという感じです。 日常的なコーディング作業なら問題なくこなせそう。 とくに、画像認識との組み合わせができるのも強い。 ブロック崩し ではブロック崩し。 HTML+JS まずHTML+JS版。一発完動で、修正としてパーティクルを出してもらっても問題なく動…
4日前

Qwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで21tok/secで動かす
きしだのHatena
試しにQwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで動かしてみたら、21tok/secと実用的な速度がでました。 Qwen3 Nextはアクティブ3Bなので、CPUで動かしてもそれなりの速度が出るはずです。 重いのはアテンションの処理なので、そこはGPUで動かして、FFNだけCPUに任せましょうというのが基本的な考え方。ここで詳しく解説してます。 CPUが得意なことをCPUにまかせて少ないVRAMでも大きめのLLMを速く動かす - きしだのHatena LM Studioでも8月くらいに出来るようになってました。 GPUメモリ4GBあればGPT-os…
5日前

ヘルプサイト刷新の全貌(フロントエンド除く): AWS × Terragrunt によるインフラ再構築、textlint プラグインの開発、etc
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは、ソフトウェアエンジニアの @ajfAfg です。弊社には複数のヘルプサイトが存在しますが、その一部を半年ほどで刷新しました。刷新と呼んでいますが、WOVN という多言語化用 SaaS の導入に加え、ヘルプサイトのコンテンツを作成するテクニカルライターの生産性向上を狙った取り組みも含まれていました。本稿では、刷新プロジェクトの中で私が担当した取り組みを紹介します。なお、本稿では特に断りがない場合、旧ヘルプサイトは刷新前のヘルプサイトを指し、新ヘルプサイトは刷新後のヘルプサイトを指すものとします。文脈から明らかな場合は単にヘルプサイトと書く場合もあります。目次目次背景刷新プロジェクトのスコープ刷新プロジェクトにおけるインフラのゴール旧ヘルプサイトのインフラ旧ヘルプサイトのインフラに関する技術的負債ほぼ全てのインフラが手動で構築されていたテストや監視がなかったリージョン間の意図しない差分が多かった事前調査および技術選定コンテンツ管理システム静的サイトジェネレーターホスティングサービスクラウドベンダーインフラ構築WOVN 導入WOVN 導入のモチベーションWOVN の導入方法静的サ
5日前

2026年3月の技術系イベント予定 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...
5日前

[MySQL Workbench] VISUAL EXPLAIN でインデックスの挙動を確認する LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2018年8月20日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。開発3センターでサーバサイドの開...
5日前

バックエンド開発Handbookを届けるために ― AI時代の知の高速道路を敷く
Timee Product Team Blog
こんにちは、タイミーでバックエンドのテックリードをしている新谷(@euglena1215)です。 今回は、社内向けに公開したバックエンド開発Handbookと、それをClaude CodeやCursorといったAIエージェント向けスキルとして届けることで、気づいたらHandbookを参照している状態を目指した取り組みについて紹介します。 バックエンド開発Handbookとは何か バックエンド開発Handbookは、タイミーのバックエンド開発における設計・実装・運用のガイドラインをまとめたドキュメント集です。GitHub Pages でホスティングし、開発者が見やすい形で公開しています。 タイミ…
5日前

Vol. 06 「その機能、本当に“今”必要ですか?」チームで挑んだ引き算と加速
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第6弾です!こんにちは!Sansan Data Intelligenceのプロダクトマネジャー(PdM)の家後佑美です。 今回のブログリレーでは、エンジニアのメンバーがそれぞれの専門性を活かした技術的なトピックを綴っています。私はPdMという立場から、エンジニアやデザイナーと共に、職能の境界を超えてプロダクトを研ぎ澄ませていった裏側を、少し違う角度から書かせてもらおうと思います。
5日前

Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~
きしだのHatena
Qwen3.5-397B-A17Bを手元で試してみました。 397Bで、アクティブ17BのMoEモデルでライセンスはApache 2.0です。 Qwen3.5-397B-A17Bは、Qwen3-Nextと同様にGated DeltaNetworkを使った線形アテンションなモデルです。なのでちょっと不安があったけど、かなりいい感じ。 Qwen3-Nextが2025年9月リリースだったことを考えると、その知見を活かしながら、ある程度並行で開発を行ったんじゃなかろうか。 Mac Studio 512GBでLM Studio、UnslothさんのところのQ4_K_Mを使って試します。 unsloth/…
5日前

Claude Codeエージェント実践 Day 24|ドーナツチャートと予算比KPI — ダッシュボード v3 で粗利を語る
Akiraさんのフィード
TL;DR予算テーブル(analytics.budget)を新設し、KPIカードを「売上実績」→「予算達成率+粗利」に進化させた月次推移を売上+粗利の 2本折れ線、カテゴリ別粗利を ドーナツチャート(Canvas API) で新規実装v3 ダッシュボードは「売上だけ」から「利益と予算が見える」状態になり、SQL は 4本 → 5本に増えた 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予定) v3 ダッシュボードv2 と比べると情報量が段違い。「売上がいくらか」ではなく「利益がど...
5日前

Ladybird adopts Rust, with help from AI
Simon Willison's Weblog
<p><strong><a href="https://ladybird.org/posts/adopting-rust/">Ladybird adopts Rust, with help from AI</a></strong></p>Really interesting case-study from Andreas Kling on advanced, sophisticated use of coding agents for ambitious coding projects with critical code. After a few years hoping Swift's platform support outside of the Apple ecosystem would mature they switched tracks to Rust their memory-safe language of choice, starting with an AI-assisted port of...
5日前

Writing about Agentic Engineering Patterns Simon Willison's Weblog
<p>I've started a new project to collect and document <strong><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a></strong> - coding practices and patterns to help get the best results out of this new era of coding agent development we find ourselves entering.</p><p>I'm using <strong>Agentic Engineering</strong> to refer to building software using coding agents - tools like Claude Code and...
5日前

Four Malicious NuGet Packages Target ASP.NET Developers With JIT Hooking and Credential Exfiltration
Socket
Socket uncovered four malicious NuGet packages targeting ASP.NET apps, using a typosquatted dropper and localhost proxy to steal Identity data and backdoor apps.
5日前

Writing code is cheap now Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>The biggest challenge in adopting agentic engineering practices is getting comfortable with the consequences of the fact that <em>writing code is cheap now</em>.</p><p>Code has always been expensive. Producing a few hundred lines of clean, tested code takes most software developers a full day or mo...
5日前

NIST(米国国立標準技術研究所)がAIエージェントの技術標準を作る取り組み「AI Agent Standards Initiative」発表。相互運用可能かつ安全なイノベーションのために
Publickey
米国商務省傘下のNIST(National Institute of Standards and Technology:米国国立標準技術研究所)は、AIエージェントの技術標準策定に取り組む「AI Agent Standards Initia...
5日前

Quoting Paul Ford Simon Willison's Weblog
<blockquote cite="https://ftrain.com/leading-thoughts"><p>The paper asked me to explain vibe coding, and I did so, because I think something big is coming there, and I'm deep in, and I worry that normal people are not able to see it and I want them to be prepared. But people can't just read something and hate you quietly; they can't see that you have provided them with a utility or a warning; they need their screech. You are distributed to millions of people, and become the local pr...
5日前

Anthropic、ルールベースではなく、コード分析により複雑な脆弱性も発見できる新機能「Claude Code Security」を提供開始
Publickey
AnthropicはClaude Codeの新機能として、複雑な脆弱性も発見できる「Claude Code Security」をリサーチプレビューとして提供開始したことを発表しました。 人間のセキュリティ専門家のようにコードを分析 Calu...
5日前
2/23 (月)

Reply guy Simon Willison's Weblog
<p>The latest scourge of Twitter is AI bots that reply to your tweets with generic, banal commentary slop, often accompanied by a question to "drive engagement" and waste as much of your time as possible.</p><p>I just <a href="https://twitter.com/simonw/status/2025918174894673986">found out</a> that the category name for this genre of software is <strong>reply guy</strong> tools. Amazing.</p> <p>Tags: <a href="https://simonwillison.net/ta...
5日前

Quoting Summer Yue Simon Willison's Weblog
<blockquote cite="https://twitter.com/summeryue0/status/2025836517831405980"><p>Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb.</p><p><img alt="Screenshot of a WhatsApp or similar messaging conversation showing a user repeatedly trying to stop an AI agent (appearing to be &quot;OpenClaw&quot;) that is au...
5日前

The Hidden Cost of Agentic Failure
Radar
Agentic AI has clearly moved beyond buzzword status. McKinsey’s November 2025 survey shows that 62% of organizations are already experimenting with AI agents, and the top performers are pushing them into core workflows in the name of efficiency, growth, and innovation. However, this is also where things can get uncomfortable. Everyone in the field knows […]
5日前

Why we no longer evaluate SWE-bench Verified
OpenAI News
SWE-bench Verified is increasingly contaminated and mismeasures frontier coding progress. Our analysis shows flawed tests and training leakage. We recommend SWE-bench Pro.
5日前

Qwen3.5-397B-A17BのThinkingを抑制する
きしだのHatena
Qwen3.5-397B-A17B、賢くていいですね。常用していいんじゃないかと思うくらいなんだけど、「今日は何日?」と聞くだけで3分考え込んでたり、思考が長すぎて使えないってなります。 「今日は5月23日、いやほんとに正しいか?ダブルチェックだ。5月23日。OK。しかしユーザーは曜日を求めてるのでは?令和で答えたほうが?もっと丁寧に?いやこれは丁寧すぎるのでは?ほんとに日付を求めてるのか?そして日付は正しいか?」みたいに延々と考えてます。 あと2024年5月23日あたりと2026年カットオフという情報をもってるようで、その間で葛藤したりもしますね。 ただ、公式だと「思考」と「高速」を選べるの…
5日前

Red/green TDD Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>"<strong>Use red/green TDD</strong>" is a pleasingly succinct way to get better results out of a coding agent.</p><p>TDD stands for Test Driven Development. It's a programming style where you ensure every piece of code you write is accompanied by automated tests that demonstrate the code works.<...
5日前

OpenAI announces Frontier Alliance Partners
OpenAI News
OpenAI announces Frontier Alliance Partners to help enterprises move from AI pilots to production with secure, scalable agent deployments.
5日前

The Claude C Compiler: What It Reveals About the Future of Software Simon Willison's Weblog
<p><strong><a href="https://www.modular.com/blog/the-claude-c-compiler-what-it-reveals-about-the-future-of-software">The Claude C Compiler: What It Reveals About the Future of Software</a></strong></p>On February 5th Anthropic's Nicholas Carlini wrote about a project to use <a href="https://www.anthropic.com/engineering/building-c-compiler">parallel Claudes to build a C compiler</a> on top of the brand new Opus 4.6</p><p>Chris Lattner ...
6日前

London Stock Exchange: Raspberry Pi Holdings plc Simon Willison's Weblog
<p><strong><a href="https://www.londonstockexchange.com/stock/RPI/raspberry-pi-holdings-plc/company-page">London Stock Exchange: Raspberry Pi Holdings plc</a></strong></p>Striking graph illustrating stock in the UK Raspberry Pi holding company spiking on Tuesday:</p><p><img alt="Stock price line chart for RASPBERRY PI showing a 3-month daily view from 24 Nov to 16 Feb. The price trends downward from around 325 to a low near 260, then sharply sp...
6日前

Claude Codeエージェント実践 Day 23|ダッシュボード設計知識を注入する — 言語を超えるナレッジの力
Akiraさんのフィード
TL;DRNext.js 向けに整理した「18種グラフ × 11種コントロール」のダッシュボード設計書を、言語非依存の グラフ選定ガイド に変換して reporting-agent の knowledge/ に注入した知識注入後に v2 ダッシュボードを生成。月次推移が横棒グラフ → 折れ線グラフ に変わり、カテゴリ別売上 セクションが追加された「何の言語で書くか」ではなく「何を伝えたいか」を知識として渡せば、技術スタックの壁は超えられる 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予...
6日前

How I think about Codex Simon Willison's Weblog
<p><strong><a href="https://www.linkedin.com/pulse/how-i-think-codex-gabriel-chua-ukhic">How I think about Codex</a></strong></p>Gabriel Chua (Developer Experience Engineer for APAC at OpenAI) provides his take on the confusing terminology behind the term "Codex", which can refer to a bunch of of different things within the OpenAI ecosystem:</p><blockquote><p>In plain terms, Codex is OpenAI’s software engineering agent, available through mul...
6日前
2/22 (日)

Claude Codeで初めてのOSSコントリビューション体験記
hang-up
※事前にOSSのREADMEやContributes.mdを確認して下さい。私の場合、AIの使用が禁止されているOSSではなかったので、試しています。(プルリクエストを出すだけなので、ダメだったとしても弾かれるはずです)続きをみる
6日前

Claude Codeエージェント実践 Day 22|レポーティングエージェント初回実行 — 設計は動くのか
Akiraさんのフィード
TL;DR昨日設計したレポーティングエージェントを実際に構築し、BigQuery → Python → HTML のダッシュボード生成に成功したWindows の Python subprocess で bq コマンドが見つからないハマりポイントがあったが、shell=True で解決。「道具を作る」エージェントならではの環境依存問題生成に成功した3つのコンポーネント(サマリーカード、データテーブル、横棒グラフ)をテンプレートとして knowledge/ に切り出した。これが安定生産の第一歩 作ったものGitHub: akira-cloudjob-public/rep...
7日前









