直近1週間の更新
3/3 (火)

AWSがOpenAIの企業向けAIエージェント基盤「OpenAI Frontier」の独占的な外部クラウドプロバイダーになると発表、AmazonがOpenAIに7兆5000億円を投資
Publickey
Amazon Web Services(AWS)とOpenAIは、企業向けのAIエージェントプラットフォームなどに関する複数年にわたる戦略的パートナーシップを発表しました。 この戦略的パートナーシップでは、AWSとOpenAIがステートフル...
数秒前

「Amazon Bedrock」でOpenAI API互換を提供開始。オープンウェイトな基盤モデルでOpenAI SDKが利用可能に
Publickey
Amazon Web Services(AWS)は、同社のAIプラットフォームであるAmazon Bedrockで提供しているMantle推論エンジンで、OpenAI APIの互換APIの提供開始を発表しました。 Amazon Bedroc...
4分前

「月刊DBマガジン」が復刻、Kindleで第一弾が販売開始
1
Publickey
翔泳社は「月刊DBマガジン」復刻版第一弾の販売をKindleで開始したと発表しました。 「月刊DBマガジン」は、1999年から2010年にかけてデータベース技術を中心に、当時最新のIT関連情報を紹介していた雑誌です。 発刊元である翔泳社は昨...
7分前

Ad Industry Moves to Set Rules Before AI Agents Control Media Budgets
PYMNTS.com
As artificial intelligence systems begin to move from generating copy to executing business decisions, the advertising industry is attempting to build infrastructure before the disruption fully arrives. A new initiative called the Ad Context Protocol, or AdCP, is emerging as a standardized way for AI agents to communicate with publishers, ad platforms and each […]The post Ad Industry Moves to Set Rules Before AI Agents Control Media Budgets appeared first on PYMNTS.com.
14分前
3/2 (月)

February sponsors-only newsletter
Simon Willison's Weblog
<p>I just sent the February edition of my <a href="https://github.com/sponsors/simonw/">sponsors-only monthly newsletter</a>. If you are a sponsor (or if you start a sponsorship now) you can <a href="https://github.com/simonw-private/monthly/blob/main/2026-02-february.md">access it here</a>. In this month's newsletter:</p><ul><li>More OpenClaw, and Claws in general</li><li>I started a not-quite-a-book about Agentic Engineering</li&g...
20分前

なぜ、現在より未来の方がAIのハルシネーションの危険度が上がっていくのか?
Zennの「大規模言語モデル」のフィード
はじめにAIのハルシネーションは精度が上がれば減ると思われがちですが、危険度は別の軸で増えていきます。ポイントはAIが間違えるかどうかより、社会がAIをどう扱うかです。ここがズレると、わりとマジで事故ります。いま起きているのは「雑な嘘」ですが、これから増えるのは「ちゃんとして見える嘘」です。粗いネジは粗い前提で使うので平和ですが、精密ネジっぽい粗悪ネジは新幹線や飛行機に混ざるとヤバいです。これは信頼の前提が壊れる現象です。結論から言うと、未来の恐さはハルシネーションの量ではなく、信用の形と検出難易度が変わることにあります。AIが賢くなるほど、人間は検算と再確認を省略しがちです。...
1時間前

【Claude】非エンジニアも使えるAIエージェント機能「Cowork」をさっくりふわっと理解する
DevelopersIO
【Claude】非エンジニアも使えるAIエージェント機能「Cowork」をさっくりふわっと理解する
1時間前

Anthropic Investigates as Claude Suffers International Outage
PYMNTS.com
Anthropic is investigating an outage that took down its Claude AI model around the world. The artificial intelligence (AI) startup said Monday (March 2) that it was looking into what it called “elevated errors” on Claude. “We have identified that the Claude API is working as intended. The issues we are seeing are related to Claude.ai and […]The post Anthropic Investigates as Claude Suffers International Outage appeared first on PYMNTS.com.
2時間前

UK Watchdog Probes Data-Sharing Among Hotel Giants
PYMNTS.com
England’s competition watchdog is investigating three international hotel chains for their data-sharing practices. The Competition and Markets Authority (CMA) announced Monday (March 2) that it was looking into the suspected sharing of “competitively sensitive information” among Hilton, Marriott and IHG Hotels. The three chains used the hotel data analytics tools STR from CoStar, which is also under investigation, the CMA added. The regulator […]The post UK Watchdog Probes Data-Sharing Among Hot
2時間前

GPT-5.3-Codex-Spark解説 — 1000tok/sの超高速AIコーディング
Zennの「大規模言語モデル」のフィード
はじめに2026年2月13日、OpenAIはGPT-5.3-Codex-Sparkをリサーチプレビューとして公開しました。Codex-Sparkは、GPT-5.3-Codexの軽量版として設計されたリアルタイムコーディング特化モデルです。最大の特徴は1,000トークン/秒以上の推論速度です。これはフルサイズのGPT-5.3-Codex(約65トークン/秒)の約15倍にあたります。この高速化を実現しているのが、Cerebras社のWafer Scale Engine 3(WSE-3)チップです。OpenAIにとって初めてのNvidia以外のハードウェアでの本番デプロイメントとなりま...
2時間前

【Aether Platform】クラウドAPI費用を削減する ── OpenVINO & OVMSで始めるローカルLLM
Zennの「大規模言語モデル」のフィード
1. はじめに:高騰するクラウドAPI費用、手元のPCで削減しませんか?GitHub Copilot、ChatGPT、Claude ── AI を活用した開発が当たり前になる一方で、クラウド API の利用料金は確実に積み上がっています。月額数千円のサブスクリプションに加え、API 経由のトークン課金、チーム全員分のシート費用。開発生産性が上がるほど API コールは増え、請求額はスケールし続けます。しかし、あなたの手元にはすでに十分な計算資源があります。開発者の PC に搭載された Intel CPU は、LLM の推論を実行できるだけの性能を持っています。クラウドに送っ...
2時間前

【Claude Code】結局CLAUDE.mdはどこに置けばいいの?読み込み順を図解で解説
Zennの「大規模言語モデル」のフィード
TL;DR(まず結論)プロジェクトのルート(ClaudeCodeを起動したフォルダ)に CLAUDE.md を1つ置くだけで十分です。~/.claude/CLAUDE.md も ~/CLAUDE.md も必須ではありません。 CLAUDE.mdとは?Claude Codeを使っていると、こんな疑問が出てきます。「Claude Codeに毎回同じ説明をしなくていい方法はないの?」「プロジェクトのルールを覚えさせておきたい」そこで登場するのが CLAUDE.md です。一言でいうと、「Claude Codeへの事前メモ書き」です。Claude Codeはセッシ...
3時間前

思想が反映されるモデルの個性
Zennの「大規模言語モデル」のフィード
思想が反映されるモデルの個性全てのAIが同じような倫理観を持ち、同じように振る舞うわけではありません。モデルごとの挙動の差異、特にルールに対する反応や拒絶の傾向を詳細に観察していくと、そこには開発元の設計思想が色濃く反映されていることが分かります。実証データは、モデルの差異が単なる性能の優劣ではなく、思想の違いに基づく構造的な個性であることを示しています。 設計思想の分水嶺最も対照的な挙動が見られるのは、オープンソースモデルとプロプライエタリ(商用)モデルの比較です。ある調査によれば、Llama 3.1やQwen 2.5といったオープンソースモデルの平均的な拒否率は、驚...
3時間前

「中身が見える?」 LLM Steerling-8B を調べて DGX Spark で動かしてみた
DevelopersIO
「中身が見える?」 LLM Steerling-8B を調べて DGX Spark で動かしてみた
3時間前

LongCat-Flash-Lite 68.5Bが24GBのグラボに乗るってどういうこと?
Zennの「大規模言語モデル」のフィード
!リンクの紹介は目視で確認。文章ドラフトおよび調査において GPT を利用しています。 0. TL;DRLongCat-Flash-Lite 68.5B は総パラメータ 68.5B の MoE(Mixture-of-Experts)モデル1トークンあたりアクティブなのは 約 3〜4.5B256k コンテキスト(YaRN RoPE)N-gram embedding を組み込んだ「Embedding Scaling」実験機という、かなり変態寄り(褒め言葉)のアーキテクチャ。(LongCat-Flash-Lite – Hugging Face)論文 ...
3時間前

Claude Codeのllms.txtを使って公式ドキュメント検索UIを作った話
Zennの「大規模言語モデル」のフィード
Claude Code の公式ドキュメント、どのページに何が書いてあるか分からない問題を解決するために、llms.txt を使った検索UIをHTMLファイル1つで作った。Claudeに「こう直して」と伝えるだけで、コードは全部AIが書いている。!必要なもの: Claude Pro / Max / Team のいずれかのプラン技術レベル: claude.aiでチャットできればOK 使い方(PCのみ)!スマホでは動きません。 モバイルアプリのArtifact環境はAPIリクエストの中継方式がPC版と異なるため、Invalid response format エラーになります。...
3時間前

【Aether Platform】ローカルLLM推論基盤 - OpenVINO & OVMS 実践ガイド
Zennの「大規模言語モデル」のフィード
Ollama / LM Studio でローカルLLMを試した、その先へ。OpenVINO / OVMS エコシステムなら、NPU推論を含むIntelハードウェアの性能をフルに活用できます。Aether Platformでも採用されている商用グレードのシステム構築を、ローカルLLM活用の「二歩目」としてコストリーズナブルに始める方法を提供する一冊です。
4時間前

AWS IAM Identity Center をIdP としてDatadog のSAML JIT プロビジョニングとGroup Mapping を設定してみた
DevelopersIO
AWS IAM Identity Center をIdP としてDatadog のSAML JIT プロビジョニングとGroup Mapping を設定してみた
5時間前

Claude Skills の skill-creator で対話形式で Skills を作成する
Zennの「大規模言語モデル」のフィード
https://github.com/anthropics/skills/tree/main/skills/skill-creatorClaude Skillsのリポジトリにskill-creatorあります。skill-creatorを使って対話形式でドキュメント生成をするSkillsを作った話を紹介します。!skill-creatorの紹介となっており、都合により成果物は添付していません。 課題:LangGraph のドキュメント管理が辛いLangGraphでエージェントを開発していると、こんな作業が定期的に発生します。ノードを追加・変更するたびにノード一覧表を手...
5時間前

AIエージェントのメモリ消失問題を解決するデュアルレイヤーフォールバック
Zennの「大規模言語モデル」のフィード
AIエージェントがメモリを失い続ける理由AIエージェントがユーザーと30分間会話した後、新しいセッションを開始すると、メモリ統合のLLM呼び出しが失敗することがあります。私たちのインスタンスで追跡したところ、メモリ統合の失敗率は単一モデルで約15%でした。 デュアルレイヤーフォールバック2つの独立したフォールバックループで解決:レイヤー1(トランスポート): HTTPエラー → 指数バックオフ → フォールバックチェーンレイヤー2(ビジネスロジック): ツール呼び出し検証 → 失敗なら次のモデルllama-3.3-70b → qwen3-32b → llama...
5時間前

フォーマット定義を信じてはいけない ― なぜAIの出力は静かにずれていくのか
Zennの「大規模言語モデル」のフィード
こんな経験はないだろうか。昨日まで期待通りに動いていたAIが、今日は微妙に違う答えを返してくる。同じプロンプトを使っているのに、出力のトーンや構造がどこか変わっている。エラーは出ていない。壊れてもいない。ただ、静かにずれている。これをドリフトと呼ぶ。そしてドリフトが起きる理由は、私たちがAIに対して持っている、ある根本的な誤解に由来する。 「フォーマットを渡せば安定する」という誤解AIと協働するとき、多くの人がこう考える。フォーマットを整えれば出力が安定する役割定義を書けば期待通りに動くスキル仕様を渡せば再現性が保証されるこの発想は自然だ。プログラマーなら特に...
6時間前

クラスメソッドオペレーションズ カスタマーサクセス部 クラウド運用チームにジョインしました、中脇です。
DevelopersIO
クラスメソッドオペレーションズ カスタマーサクセス部 クラウド運用チームにジョインしました、中脇です。
6時間前

【Security Hub修復手順】[SageMaker.3] ユーザーは SageMaker ノートブックインスタンスへのルートアクセスを持つべきではない
DevelopersIO
AWS SecurityHub 基礎セキュリティのベストプラクティスコントロール修復手順をご紹介します。
6時間前

Cursorは「コードを書くだけ」じゃない。Agent Skillsで仮説検証を効率化する
Wantedly Engineer Blog
はじめまして。Wantedlyでプロダクトマネージャーをしている上山です。今回は社内の AI 活用イベント「Hac...
6時間前

New Branch CFO Say IPO Is a Discipline Not a Destination
PYMNTS.com
Watch more: Monday Conversation With Branch’s Matt Peterson Sixty-eight percent of Americans live paycheck to paycheck. For years, financial experts blamed the individual. Too much discretionary spending, not enough discipline. Branch CFO Matt Peterson has a different theory, and data to back it up. The problem isn’t what people are spending. It’s when they’re […]The post New Branch CFO Say IPO Is a Discipline Not a Destination appeared first on PYMNTS.com.
6時間前

Embedding Security: Designing Fraud Risk Out of Business Transactions
PYMNTS.com
Embedded payments are becoming a core feature of modern business platforms, weaving transactions directly into everyday operational workflows. As payments shift, however, fraud risk shifts with them. In embedded environments, threats can no longer be managed effectively through point solutions that activate only after a transaction is already in motion. Instead, fraud prevention must move […]The post Embedding Security: Designing Fraud Risk Out of Business Transactions appeared first on PYMNTS.c
6時間前

Mastercard’s Gerber Says CISOs Can’t Protect What They Can’t See
PYMNTS.com
In cybersecurity, visibility has always been a prerequisite for control. Today, the scale and stakes of what organizations can no longer see are approaching a tipping point. The result is not simply greater complexity, but a growing inability for organizations to identify where their own infrastructure begins and ends. “If you think about the […]The post Mastercard’s Gerber Says CISOs Can’t Protect What They Can’t See appeared first on PYMNTS.com.
6時間前

52% of Small Businesses Don’t Revolve Their Credit Card Balances
PYMNTS.com
Small businesses are treating credit cards less like a backup and more like a flexible operating tool, and the way they use them is starting to look surprisingly consumer-like. That is the throughline of “SMB Growth Monitor: How Firms Use and Choose Credit Cards” a PYMNTS Intelligence report based on a survey of 583 U.S. […]The post 52% of Small Businesses Don’t Revolve Their Credit Card Balances appeared first on PYMNTS.com.
6時間前

RAGの検索精度が上がらない? 抽出ルールを「可視化」してHITLで改善する
Zennの「大規模言語モデル」のフィード
背景少し試したいことがあり、改めてRAGを作ってみることにしたのですがそのときに改めて感じたLLMに頼りきらない運用のポイントについて書いてみます RAG とはGemini 曰く、下記の定義です!RAG(Retrieval-Augmented Generation)は、日本語で「検索拡張生成」と呼ばれる技術です。ざっくり言うと、「AIに最新の辞書や社内マニュアルを持たせて、それを見ながら答えさせる仕組み」のこと。AI(LLM)が持つ「知ったかぶり(ハルシネーション)」という弱点を克服するための特効薬として、今やビジネス現場では必須の技術になっています。最新の辞書や...
6時間前

Samsung and Perplexity Push New Agentic Tools Into Phones and the Cloud
PYMNTS.com
It was a big week in The Prompt Economy, with big moves from big companies making big claims. None were bigger than Samsung, which used its user conference to herald what it says is “The Beginning of Truly Agentic AI.” To back that up Samsung says its Galaxy Unpacked 2026 event was designed around […]The post Samsung and Perplexity Push New Agentic Tools Into Phones and the Cloud appeared first on PYMNTS.com.
6時間前

[登壇資料]「Claude Coworkで非エンジニアも業務効率化しよう」で登壇しました
DevelopersIO
「Claude Coworkで非エンジニアも業務効率化しよう」というタイトルで登壇しました。普段のAI活用からClaude Coworkを使った提案書自動作成のデモまで、資料とともに内容を紹介します。
6時間前

Claude Code と Pencil MCP を使って自然言語で Web ページをデザインしてみた
DevelopersIO
Pencil MCP を Claude Code から使い、自然言語だけで Web ページのプロトタイプをデザインしてみました。セットアップ手順と5種類のデザイン結果を紹介します。
7時間前

大規模言語モデルに基づくエージェントの台頭と可能性:サーベイ
Zennの「大規模言語モデル」のフィード
大規模言語モデルに基づくエージェントの台頭と可能性:サーベイ著者: Zhiheng Xi, Wenxiang Chen, Xin Guo, Wei He, Yiwen Ding, Boyang Hong, Ming Zhang, Junzhe Wang, Senjie Jin, Enyu Zhou, Rui Zheng, Xiaoran Fan, Xiao Wang, Limao Xiong, Yuhao Zhou, Weiran Wang, Changhao Jiang, Yicheng Zou, Xiangyang Liu, Zhangyue Yin, Shihan Dou, ...
7時間前

Unauthorized AI Agent Execution Code Published to OpenVSX in Aqua Trivy VS Code Extension
Socket
OpenVSX releases of Aqua Trivy 1.8.12 and 1.8.13 contained injected natural-language prompts that abuse local AI coding agents for system inspection and potential data exfiltration.
7時間前

「ものづくり」と「IT」の架け橋になりたい! 製造ビジネステクノロジー部にジョインしたnaoです。
DevelopersIO
「ものづくり」と「IT」の架け橋になりたい! 製造ビジネステクノロジー部にジョインしたnaoです。
7時間前

[AWS Technical Support Note] วิธีการตรวจสอบ Execution Logs และ Access Logs ของ API Gateway (REST API)
DevelopersIO
ตรวจสอบ Execution Logs และ Access Logs ของ API Gateway (REST API)
8時間前

GitHubのWiki更新をトリガーにGitHub ActionsでWikiのコンテンツをBedrockナレッジベースに同期してみた
DevelopersIO
GitHubのWiki更新をトリガーにGitHub Actionsを起動、WikiコンテンツをS3バケット経由でS3 Vectorsに同期することで、Bedrockナレッジベースとして活用できる仕組みを構築してみました。
8時間前

Claude CodeからMiro MCP Serverを使ってボードを操作してみた
DevelopersIO
Claude CodeからMiro MCP Serverを使ってボードを操作してみた
8時間前

Claude Code に C/C++/Rust/Zig で同じ課題を実装させたら、言語ごとのふるまいに差は出るのか
1
DevelopersIO
Claude Code (Opus 4.6) に LRU キャッシュと Thread Pool を C, C++, Rust, Zig で実装させ、生成品質・修理過程・コード理解度を比較しました。
9時間前

🔥 DeepSeek V4 リーク情報まとめ ── 2026年最大のAIモデルが「すべてを変える」かもしれない
Zennの「大規模言語モデル」のフィード
最終更新: 2026年3月2日 はじめに:なぜ世界はDeepSeek V4に震えているのか2025年1月、DeepSeek R1の登場でNasdaqは3%暴落し、Nvidiaの時価総額は一夜にして6,000億ドル吹き飛んだ。あれから1年——今度はその「続編」が来る。Financial Timesが2月28日に報じたところによると、DeepSeek V4は2026年3月初旬に正式リリース予定だ。当初は旧正月(2月17日前後)の公開が噂されていたが延期され、コミュニティの予測はQ1〜Q2 2026に修正されていた。しかしここに来て、ついに具体的なタイムラインが浮上した。CN...
9時間前

Matsuriba MAX 2026にゴールドスポンサーとして協賛します
Sansan Tech Blog
こんにちは。Sansan中部支店でEightの開発をしている井上です。 昨年に引き続き、Sansanは東海地方最大の学生エンジニアイベント「Matsuriba MAX 2026」にゴールドスポンサーとして協賛することになりました!🎉 matsuriba.nxtend.or.jp
9時間前

AI開発会社を選ぶ際に重要な技術ポイントとは?
Zennの「大規模言語モデル」のフィード
AI開発会社を選ぶ際に重要な技術ポイントとは?(CTO向けチェックリスト)AI開発会社選びは「モデル精度」だけ見ても失敗します。データ品質、評価設計、MLOps、監視、セキュリティまで“本番運用”の説明ができないとPoC止まりに。CTO向けに技術チェックポイントと質問リストを整理します。 結論:AIは“作る”より“運用する”で差が出るAIプロジェクトの失敗は、技術力不足よりも 運用設計の欠落 が原因になりがちです。成功指標(Acceptance Criteria)が曖昧データの品質・権利・責任境界が不明本番監視・再学習・コスト管理が未設計セキュリティ/コンプライ...
9時間前

【Amazon Connect】データテーブルを活用してブラックリスト電話番号を管理してみた
DevelopersIO
【Amazon Connect】データテーブルを活用してブラックリスト電話番号を管理してみた
10時間前

Claude Codeにコード解析情報を渡すとtokenは減らせるのか?検証してみました🙆
Zennの「大規模言語モデル」のフィード
挨拶こんにちは!ブルーモ証券のRailsエンジニアの浜口です(社内では、はまちゃんと呼ばれています)。突然なんですが、最近の生成AIは本当にすごいですよね。🤖すでに仕事の実装において、かなりの範囲をカバーできる精度になってきていると感じています。ただし、やっぱり使用する際のコストが気になってしまう。。。🤔と思ったので、今回は、なんとかtoken使用量を減らす方法が無いか探るべく、普段使っているClaude Codeに対して検証を行ってみたので、検証結果を共有していきたいと思います!✊ 検証設計 検証方法自前で用意したコード解析ツールを用いてRubyコードを解析...
10時間前

障害対応も「One Team」で。ウォンテッドリーでのSREの働き方
1
Wantedly Engineer Blog
ウォンテッドリー CTOの安間です。今回はサーバー管理から全社的な開発基盤の向上までウォンテッドリーの全サービスを...
10時間前

VPC Endpoint로 EC2에서 S3, ECR, Bedrock에 프라이빗하게 접근하기
DevelopersIO
VPC Endpoint로 EC2에서 S3, ECR, Bedrock에 프라이빗하게 접근하는 방법을 정리해 봤습니다.
12時間前

【UXCascade】UXをAIエージェントでテストする
Zennの「大規模言語モデル」のフィード
はじめに「UIを作ったはいいけど、ユーザビリティテストは時間もお金もかかるから後回し」——そんな経験をしたことはないでしょうか。AIが数秒でUIのバリエーションを生成できる時代になった今、逆説的にUX評価がボトルネックになっています。今回は arXiv に投稿された論文 "UXCascade: Scalable Usability Testing with Simulated User Agents"(Holter et al., 2026)を紹介します。https://arxiv.org/abs/2601.15777また、コードが公開されていなかったので、再現実装を行なっ...
12時間前

[アップデート] EKS Auto Mode で AWS 管理コンポーネントのログを出力できるようになりました
DevelopersIO
[アップデート] EKS Auto Mode で AWS 管理コンポーネントのログを出力できるようになりました
12時間前

Bedrockナレッジベースに外部システムのAPI仕様を格納してDevOps Agentのログ調査に活用してみた
DevelopersIO
DevOps Agentの調査精度を上げるためにサーバーレスな構成でナレッジベースを構築して連携させてみました。ナレッジベースをチューニングしてRun Bookが最適化できれば精度が上がりそうな感触です。
12時間前

探索型開発と向き合う、kintoneプラットフォームエンジニアリングの挑戦
Cybozu Inside Out | サイボウズエンジニアのブログ
状況が変化する中での意思決定前回記事 なぜ、kintoneにプラットフォームエンジニアリング部は生まれたのか で触れた、プロダクト開発とプラットフォーム開発の 「時間軸の違い」。探索型プロダクト開発(短期)仮説検証 / 変更前提 / 速度重視プラットフォーム(長期)安定運用 / 先回り設計 / 継続投資どちらも正しい。いま私たちが直面しているのは、「どちらが正しいか」ではなく、複数の選択肢の中から何を選ぶかという問題です。選択肢が増えた世界で、どうやって選び続けるのか。こんにちは。プラットフォームエンジニアリング部所属の aki (@aki366) です。この記事の構成は以下の通りです。状況が変化する中での意思決定なぜプラットフォームは難しいのかQ. 今のPfE部で、率直に難しいと感じていることは何ですか?Q. 組織面と技術面、それぞれで課題はありますか?PfE部は何を担う存在なのかQ. インフラエンジニアやSREと比べると、どんなところが違うと思いますか?Q. 改めて、PfE部の役割を一言で表すとしたら何でしょう?Q. 逆に、「これはプラットフォームエンジニアリングっぽくないな」と感
13時間前

VPoE 河合およびCTO 大垣が業務執行役員にW就任 〜AI時代最速の開発組織を目指して〜
2
エムスリーテックブログ
はじめに 2026年3月1日、VPoE 河合俊典およびCTO 大垣慶介が新たに業務執行役員に就任し、それぞれ業務執行役員VPoEおよび業務執行役員CTOとなりました。 本記事では、Q&A形式で業務執行役員就任の背景と2人の魅力、これからのエムスリーエンジニアリンググループについてを包み隠さずお伝えします! 左から取締役CPO山崎、業務執行役員CTOの大垣、業務執行役員VPoE河合 はじめに Q1. なぜ今2人が業務執行役員に? Q2. “AI時代最速”とは、何の速度を最速化することか? AIの民主化 => それぞれがプロダクト作りの主人公に 意思決定をボトルネックにしないための組織変革 Q3.…
13時間前

Claude、App Store 1位に。ペンタゴンに拒否された翌週の逆転劇
Zennの「大規模言語モデル」のフィード
Claudeが3月1日、Apple App Storeで1位を獲得した。先週ペンタゴンに「サプライチェーンリスク」指定されたばかりのAnthropicにとって、皮肉すぎる展開だ。 何が起きたのかトランプ政権は2月27日、Anthropicを「国家安全保障上のサプライチェーンリスク」に指定した。全連邦機関にClaudeの即時利用停止を命じ、2億ドル規模の国防総省契約を打ち切った。この指定は通常、ファーウェイのような敵対的外国企業に対して使われるもので、米国のAI企業に適用されたのは史上初だ。背景にあるのはAnthropicの拒否姿勢。国防総省がClaudeの安全ガードレールの完...
13時間前

AI生成コードはなぜ追跡できないのか
Zennの「大規模言語モデル」のフィード
フォレンジック視点で理解するLLMコーディングの本質!フォレンジック(デジタル・フォレンジック)とは、単なる原因調査ではありません。証拠を保全し、何が起きたのかを第三者に説明可能な形で再現・証明するための調査技術です。目的は「誰が・いつ・何をしたか」の説明責任(accountability)を成立させることにあります。従来のソフトウェア開発では、ソースコードとコミット履歴を追跡すれば、変更の理由や責任の所在を比較的明確に辿れました。しかしLLMを用いた開発では、コミット履歴だけでは変更理由を説明できなくなります。AIでコードを書いていると、次のような経験はありませんか。...
14時間前

Crypto Sector Suffers Exodus of Reliable Retail Investors
PYMNTS.com
Retail investors are reportedly leaving the cryptocurrency sector, robbing the industry of a dependable driver. That’s according to a report Sunday (March 1) from Bloomberg News, which says the speculative demand that once centered around crypto has shifted into stocks. Since late 2024, retail investors have steadily shifted toward equities, a trend that sped […]The post Crypto Sector Suffers Exodus of Reliable Retail Investors appeared first on PYMNTS.com.
14時間前

非エンジニアが育てる最強のRAGを目指して。「GraphRAG Visual Editor」進化の軌跡
Zennの「大規模言語モデル」のフィード
🕸️ はじめに:なんでわざわざ「手動」でグラフを作るの?こんにちは! ルミナイR&Dチームの宮脇彰梧です。みなさん、RAG やってますか?最近、この界隈でめちゃくちゃ熱いのが 「GraphRAG(ナレッジグラフ活用)」 ですよね。ドキュメントをただのテキストとして扱うだけじゃなくて、「ノード」と「エッジ」のネットワークとして捉えちゃうやつです。これを使うと、普通のベクトル検索じゃ答えられないような、「AとCは、実はBを介して繋がってるよね?」みたいな高度な推論ができるようになります。でも……既存のGraphRAGツール(Microsoftのやつとか、LangChai...
14時間前

Chinese Tech Firm Honor Debuts Humanoid Robot and Robot Phone
PYMNTS.com
Chinese device marker Honor has reportedly introduced a humanoid robot and “robot phone.” The company demonstrated those products Sunday (March 1) at MWC Barcelona 2026, Bloomberg News reported, calling it Honor’s push to reestablish itself as an artificial intelligence-focused hardware company. Spun off from Huawei in 2020, Honor began as a budget brand before […]The post Chinese Tech Firm Honor Debuts Humanoid Robot and Robot Phone appeared first on PYMNTS.com.
14時間前

AIエージェントと協業するチームの始め方
1
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事はkintoneの生成AIチームで連載中のkintone AIリレーブログ2026の7本目の記事です。 リレーブログでは、生成AIチームのメンバーがAIトピックに限らずさまざまなことについて発信していきます。こんにちは、kintoneの生成AIチームでエンジニアリングマネージャーをしている立山です。みなさんのチームはAIを活用していますか?ここ最近はコーディングエージェントが高速にそこそこいいコードを作ってくれる時代で、個人の開発生産性は上がっていると思います。一方で、チームでAIを活用するというのはまだまだ限られているのではないでしょうか?この記事ではチームでAI、特に自律的に仕事を進めてくれるAIエージェントとの協業のはじめ方についてお話ししようと思います。私たちのチームでは、AIエージェントとの協業を始めるにあたって、以下の3つに取り組みました。仕事を言語化し、Agent Skills として定義する — 「すごいAIシステム」を作る意識ではなく、まず仕事の形を整え、AIに委任できる手順に落とし込むチームで共有可能な資産にする — 個人のノウハウに留めず、チーム全体で使え
16時間前

[アップデート] Amazon CloudWatch Logs の組織一元管理機能で送信先ロググループ名がカスタマイズできるようになりました
1
DevelopersIO
[アップデート] Amazon CloudWatch Logs の組織一元管理機能で送信先ロググループ名がカスタマイズできるようになりました
18時間前

AWS、ログイン不要で「Aurora DSQL」をすぐ試せるプレイグラウンド公開。PostgreSQLとの互換性チェックに
3
Publickey
Amazon Web Services(AWS)は、同社のデータベースサービスAmazon Aurora DSQLを試せるプレイグラウンドの公開を発表しました。 Amazon Aurora DSQLは、ほぼ無制限にスケールする大規模分散デー...
1日前

Vercel、単一のTypeScriptコードでSlack、Teams、Discordをはじめ主要チャットサービスに対応したチャットボットが作れる「Chat SDK」、オープンソースで公開
4
Publickey
Vercelは、単一のTypeScriptコードで複数のチャットプラットフォームに対応したチャットボットを構築できるオープンソースの「Chat SDK」をパブリックベータで公開しました。 You can now write chat bot...
1日前
3/1 (日)

DevRevでSLA(サービスレベルアグリーメント)を設定し、チケットの対応期限を可視化してみた
DevelopersIO
DevRevでカスタマーサポートの品質を維持するために欠かせない、SLA(対応期限)の設定手順をご紹介します。
1日前

Quoting claude.com/import-memory Simon Willison's Weblog
<blockquote cite="https://claude.com/import-memory"><p><code>I'm moving to another service and need to export my data. List every memory you have stored about me, as well as any context you've learned about me from past conversations. Output everything in a single code block so I can easily copy it. Format each entry as: [date saved, if available] - memory content. Make sure to cover all of the following — preserve my words verbatim where possible: Instructions I've given you ...
1日前

同じ年齢で、あの人は何をしていた? -- 世界の著名人24人の「年齢別達成マップ」を作ってみた
hang-up
27歳のエンジニアです。副業を検討していく中で、ふと「自分と同じ年齢のとき、世界を変えた人達は何をしていたんだろう」と気になりました。調べ始めて、起業家・科学者・アーティスト・スポーツ選手まで24人分の「年齢別達成マップ」を作りました。続きをみる
1日前

Interactive explanations Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>When we lose track of how code written by our agents works we take on <strong>cognitive debt</strong>.</p><p>For a lot of things this doesn't matter: if the code fetches some data from a database and outputs it as JSON the implementation details are likely simple enough that we don't need to care. ...
2日前

minimatch Patches 3 High-Severity ReDoS Vulnerabilities
Socket
minimatch patched three high-severity ReDoS vulnerabilities that can stall the Node.js event loop, and Socket has released free certified patches.
2日前
2/28 (土)

Our agreement with the Department of War
OpenAI News
Details on OpenAI’s contract with the Department of War, outlining safety red lines, legal protections, and how AI systems will be deployed in classified environments.
2日前

Please, please, please stop using passkeys for encrypting user data Simon Willison's Weblog
<p><strong><a href="https://blog.timcappalli.me/p/passkeys-prf-warning/">Please, please, please stop using passkeys for encrypting user data</a></strong></p>Because users lose their passkeys <em>all the time</em>, and may not understand that their data has been irreversibly encrypted using them and can no longer be recovered.</p><p>Tim Cappalli:</p><blockquote><p>To the wider identity industry: <em>please stop p...
3日前

Claude Codeエージェント実践 Day 28|28日間のふりかえり — 自分専用の専門家チームは作れたか
Akiraさんのフィード
!シリーズ: Claude Codeエージェント実践シリーズGitHub: agent-scaffold-factory / data-analysis-agent / reporting-agent TL;DR28日間で設計した4体のエージェントのうち、実際に作れたのは2体。設計と現実のギャップは大きかったが、4つのフレームワーク(2層PDCA・部下育成モデル・エージェントモデリング・道具作りパターン)は再利用できる資産になった「自分専用の専門家を揃える」の答え——専門家は育てるものであり、テンプレートから即座に完成するものではない。28日で2体が現実的なペースシリー...
3日前

An AI agent coding skeptic tries AI agent coding, in excessive detail
Simon Willison's Weblog
<p><strong><a href="https://minimaxir.com/2026/02/ai-agent-coding/">An AI agent coding skeptic tries AI agent coding, in excessive detail</a></strong></p>Another in the genre of "OK, coding agents got good in November" posts, this one is by Max Woolf and is very much worth your time. He describes a sequence of coding agent projects, each more ambitious than the last - starting with simple YouTube metadata scrapers and eventually evolving to this:</p><...
3日前
Free Claude Max for (large project) open source maintainers Simon Willison's Weblog
<p><strong><a href="https://claude.com/contact-sales/claude-for-oss">Free Claude Max for (large project) open source maintainers</a></strong></p>Anthropic are now offering their $200/month Claude Max 20x plan for free to open source maintainers... for six months... and you have to meet the following criteria:</p><blockquote><ul><li><strong>Maintainers:</strong> You're a primary maintainer or core team member of a public rep...
3日前

Unicode Explorer using binary search over fetch() HTTP range requests Simon Willison's Weblog
<p><strong><a href="https://tools.simonwillison.net/unicode-binary-search">Unicode Explorer using binary search over fetch() HTTP range requests</a></strong></p>Here's a little prototype I built this morning from my phone as an experiment in HTTP range requests, and a general example of using LLMs to satisfy curiosity.</p><p>I've been collecting <a href="https://simonwillison.net/tags/http-range-requests/">HTTP range tricks</a> for a w...
3日前
2/27 (金)

StegaBin: 26 Malicious npm Packages Use Pastebin Steganography to Deploy Multi-Stage Credential Stealer
Socket
Socket uncovered 26 malicious npm packages tied to North Korea's Contagious Interview campaign, retrieving a live 9-module infostealer and RAT from the adversary's C2.
3日前

10日間のインターンでk8s Self-hosted Runnerを構築し社内のCI/CD基盤を新たに整備した話
エムスリーテックブログ
はじめまして! 2026年の2月後半に10日間、エムスリーのAI・機械学習チームでインターンをしていた竜です。 この記事では、セルフホストされた社内のCI/CD基盤を新しく構築し、その上で弊チームにおいてデプロイ時間を約半分短縮した事例について紹介します。 合わせて、1人の学生の視点から見たエムスリーの雰囲気であったり良さを紹介できればと思います! 最終日に食べたランチ
3日前

ウォンテッドリーの推薦システムを支えるMLOps -現状の取り組みと課題-
Wantedly Engineer Blog
はじめにウォンテッドリーでデータサイエンティストとして働いている市村です。私たちのチームは Wantedly Vi...
3日前

Joint Statement from OpenAI and Microsoft
OpenAI News
Microsoft and OpenAI continue to work closely across research, engineering, and product development, building on years of deep collaboration and shared success.
3日前

OpenAI and Amazon announce strategic partnership
OpenAI News
OpenAI and Amazon announce a strategic partnership bringing OpenAI’s Frontier platform to AWS, expanding AI infrastructure, custom models, and enterprise AI agents.
3日前

Scaling AI for everyone
OpenAI News
Today we’re announcing $110B in new investment at a $730B pre money valuation. This includes $30B from SoftBank, $30B from NVIDIA, and $50B from Amazon.
3日前

Introducing the Stateful Runtime Environment for Agents in Amazon Bedrock
OpenAI News
Stateful Runtime for Agents in Amazon Bedrock brings persistent orchestration, memory, and secure execution to multi-step AI workflows powered by OpenAI.
3日前

【資料公開】「LLMアプリの品質保証って何すればいいの?」の全体像を整理して勉強会をやりました
Cybozu Inside Out | サイボウズエンジニアのブログ
speakerdeck.comこんにちは!サイボウズOfficeという製品でQAをしている水谷(@dog_dog_3dog)です。社内で「LLMアプリの品質保証 ~LLMの特性から全体像まで~」というテーマで勉強会を主催しました。この記事では、勉強会の内容と開催の背景を簡単に紹介します。資料の内容資料では、ざっくり以下のような流れで話をしています。COMPASからのケーススタディ LLMアプリ独自の品質特性 リスク分析 LLMアプリ全体の品質保証 開催の背景私がLLMアプリの品質保証に取り組み始めた頃、全体像を俯瞰できる資料が少なく、テストの枠組みを考えるのに苦労しました。そこで、今後社内で別のLLMアプリが開発される時に全体感を掴むための一つのきっかけになればと思い、勉強会を実施しました。なお、この勉強会は、産業技術総合研究所(産総研)が主催する「AI品質マネジメント講座」に参加させていただいたことに影響を受けて企画したものです。講座で多くのことを学ばせていただきました。産総研と講師の皆さまには大変お世話になりました。おわりに自分自身もまだまだ試行錯誤の途中ですが、この資料がこれから
4日前

cdk8s をもっと使いこなす - kintone AI チームの活用 Tips
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone の生成 AI チームで連載中の kintone AIリレーブログ 2026 の 6 本目の記事です。 リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone 生成 AI チームの 386jp です。前回の記事「cdk8s を使ってみた! - TypeScript で Kubernetes を管理する実践 Tips」では、 cdk8s を導入した背景と実感したメリットを紹介しました。今回は、より実践的な内容として、私たちのチームが cdk8s を使う上で工夫しているパターンを詳しく紹介します。目次:前回のおさらいkintone AI チームでの活用core と apps によるコンポーネント管理config ディレクトリ: 設定ファイルを簡単に管理するresources ディレクトリ: CRD を TypeScript の世界に取り込むsrc/resources ディレクトリ: よく使うマニフェスト定義をまとめるまとめWe are hiring !!前回のおさらい前回の記事では
4日前

Vol.07「アドホック」と「半自動化」と「汎用化」、3つのテーマを乗り越えた分析プロジェクト
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーVol.07です。 はじめに:3つのハードル Sansan事業部プロダクト室と研究開発部に所属している、データサイエンティストの丸尾です。私は、新規プロダクトであるSansan Data Intelligence(SDI)の開発において、立ち上げ期のカオスの中にいました。SDIは、顧客のデータをお預かりして名寄せ・クレンジングを行うプロダクトです。その性能を元に意思決定が行われるため、トライアルとして実際にデータをお預かりし、名寄せ結果やデータの傾向を分析してレポートするサービスを提供しています。私はこのト…
4日前

SOC 2 監査に耐えうる特権管理: 「代理操作」を支えるアイデンティティ分離と実装パターン
株式会社ログラス テックブログのフィード
こんにちは。ログラス プロダクト基盤部の小林です。私たちのチームでは、マルチテナント環境における「安全な代理操作」の仕組みについてアップデートを進めている最中です。今回は、その設計や検証の過程で整理した知見の一部をご紹介します。「自分がこの操作をしたときだけエラーが出る。画面を見て調査してくれないか?」B2B SaaSや業務システムを運用していると、こうした 「顧客の代わりにシステムを操作したい」 という要件に必ず直面します。突発的なトラブル対応はもちろん、特にエンタープライズ向けのSaaSでは、導入コンサルタントによる初期セットアップや、過年度データの移行支援など、顧客と並走し...
4日前

An update on our mental health-related work
OpenAI News
OpenAI shares updates on its mental health safety work, including parental controls, trusted contacts, improved distress detection, and recent litigation developments.
4日前

Claude Codeエージェント実践 Day 27|「道具を作るエージェント」の設計パターン — Week 4 を振り返る
Akiraさんのフィード
TL;DRWeek 2 のデータ分析エージェントは「既存ツールを使う」、Week 4 のレポーティングエージェントは「ツールそのものを作る」——この違いを設計パターンとして整理したfetch_data() + generate_html() の2関数設計は「入力仕様と出力仕様を分離する」パターンの実践だったDay 26 の反省を踏まえ、エージェント間の引き継ぎ設計を具体的に見直した。速く作れることと正しく作ることは別の話 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予定)今日はコー...
4日前

Malicious Go “crypto” Module Steals Passwords and Deploys Rekoobe Backdoor
Socket
An impersonated golang.org/x/crypto clone exfiltrates passwords, executes a remote shell stager, and delivers a Rekoobe backdoor on Linux.
4日前

Hoard things you know how to do
Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Many of my tips for working productively with coding agents are extensions of advice I've found useful in my career without them. Here's a great example of that: <strong>hoard things you know how to do</strong>.</p><p>A big part of the skill in building software is understanding what's possible and...
4日前

Quoting Andrej Karpathy Simon Willison's Weblog
<blockquote cite="https://twitter.com/karpathy/status/2026731645169185220"><p>It is hard to communicate how much programming has changed due to AI in the last 2 months: not gradually and over time in the "progress as usual" way, but specifically this last December. There are a number of asterisks but imo coding agents basically didn’t work before December and basically work since - the models have significantly higher quality, long-term coherence and tenacity and they can power thro...
4日前
2/26 (木)

Semantic Layers in the Wild: Lessons from Early Adopters
Radar
My first post made the case for what a semantic layer can bring to the modern enterprise: a single source of truth accessible to everyone who needs it—BI teams in Tableau and Power BI, Excel-loving analysts, application integrations via API, and the AI agents now proliferating across organizations—all pulling from the same governed, performant metric […]
4日前

「AIと一緒に開発する」を本格始動して 1ヶ月の振り返り
63
カミナシ エンジニアブログ
「カミナシ レポート」の開発・運用をしている furuya です。最近我が家では成長してきた子どもたちのことを考えて寝室含めて部屋の配置換えを検討しており、そのパズルに頭を悩ませています。それはさておき今回は「カミナシ レポート」の開発において AI Agent を主軸にした開発スタイルを取り入れたお話です。 背景 近年の AI Agent の進化は目覚ましいですね。日々情報がアップデートされる中、カミナシのエンジニアリング組織としてもこの流れについていかなければならない、ということで各チームいろんなことにトライしており、組織的にもそれが推奨されています。もちろん、前提として以前から GitH…
4日前

Pacific Northwest National Laboratory and OpenAI partner to accelerate federal permitting
OpenAI News
OpenAI and Pacific Northwest National Laboratory introduce DraftNEPABench, a new benchmark evaluating how AI coding agents can accelerate federal permitting—showing potential to reduce NEPA drafting time by up to 15% and modernize infrastructure reviews.
4日前

LightGCNをマルチビヘイビアへ拡張する
5
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでデータサイエンティストをしている角川(@nogawanogawa)です。以前のブログ...
4日前

OpenAI Codex and Figma launch seamless code-to-design experience
OpenAI News
OpenAI and Figma launch a new Codex integration that connects code and design, enabling teams to move between implementation and the Figma canvas to iterate and ship faster.
4日前

今、Eightで働く魅力
4
Sansan Tech Blog
名刺アプリ「Eight」の開発責任者の間瀬です。Sansan株式会社に入社して15年以上が経過しました。Eightには公開前のアルファ版の時代からインフラ担当として関わっており、AWS、Chef、Terraformなどその時々の新しめのサービスやツールの導入など、さまざまな ”歴史” を築いてきました。 一生現場のエンジニアとしてやっていくものと思っていましたが、インフラやSREのグループマネージャを経てEight開発全体の責任者となっていました。インフラだけでなくWebアプリケーションエンジニアやモバイルアプリケーションエンジニアもマネジメントする立場になるとは、夢にも思っていませんでした。…
4日前

Google API Keys Weren't Secrets. But then Gemini Changed the Rules. Simon Willison's Weblog
<p><strong><a href="https://trufflesecurity.com/blog/google-api-keys-werent-secrets-but-then-gemini-changed-the-rules">Google API Keys Weren&#x27;t Secrets. But then Gemini Changed the Rules.</a></strong></p>Yikes! It turns out Gemini and Google Maps (and other services) share the same API keys... but Google Maps API keys are designed to be public, since they are embedded directly in web pages. Gemini API keys can be used to access private files and make ...
4日前

Quoting Benedict Evans Simon Willison's Weblog
<blockquote cite="https://www.ben-evans.com/benedictevans/2026/2/19/how-will-openai-compete-nkg2x"><p>If people are only using this a couple of times a week at most, and can’t think of anything to do with it on the average day, it hasn’t changed their life. OpenAI itself admits the problem, talking about a ‘capability gap’ between what the models can do and what people do with them, which seems to me like a way to avoid saying that you don’t have clear product-market fit. </p>...
4日前

npm Introduces minimumReleaseAge and Bulk OIDC Configuration
Socket
npm rolls out a package release cooldown and scalable trusted publishing updates as ecosystem adoption of install safeguards grows.
4日前

JUnit 6の変更点をKotlin開発者目線で掘り下げます — suspend対応とJSpecifyを中心に
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の132週目の記事です!3年間連続達成まで残り27週となりました! はじめにこんにちは、エンジニアの三田(@Eichisanden)です。JUnit 5から実に8年ぶりのメジャーバージョン、JUnit 6が2025年9月にリリースされました。本記事ではKotlin開発者にとって興味深い suspend関数のネイティブサポート と JSpecifyによるnullability宣言 の2点を中心に掘り下げたいと思います。 JUnit 6の主な変更点本題に入る前に、JUnit 6...
5日前

AI活用スキル向上ワークショップ「Orchestration Development Workshop」記事一覧 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフーでは、開発業務に関わる全てのエンジニアを対象に、AI活用スキルを実践的に高めるワークショップ「Orchestration Development Workshop」を開始しました。この取...
5日前

Scaling Security at Sansan: How We Built an AI Agent to Automate Design Reviews
Sansan Tech Blog
In December 2025, I joined the Product Security group at Sansan as an intern. Our team is responsible for the security posture of Sansan's entire multi-product ecosystem. This includes our sales digital transformation solution Sansan and our accounting AX solution Bill One. To maintain a high securi…
5日前

入社前から自分の仕事を奪うセキュリティレビューAIエージェントを作った
Sansan Tech Blog
はじめに 2025年12月に情報セキュリティ部Product Securityグループでインターンをしました床井です。 Product Securityグループは、ビジネスデータベース「Sansan」や経理AXサービス「Bill One」をはじめとする、Sansanが提供する全てのプロダクトのセキュリティ向上を目的とした業務に取り組んでいます。具体的には、内製で脆弱性診断や、実装に着手する前の設計書をセキュリティ観点でレビューする「セキュリティ設計レビュー」などを行っています。 今回はこのセキュリティ設計レビューを一部自動化するAIエージェント「Hayami」の作成に取り組みました。インターン…
5日前

E2EテストをSaaSからPlaywrightへ移行する
KAKEHASHI Tech Blog
はじめに こんにちは。Musubi Insightチームでエンジニアをしている中村です。 Musubi Insightでは、SaaS型のE2Eテストツール mabl で14のテストを運用していましたが、認証の安定性やコード管理の面でいくつか課題がありました。 昨今のフロントエンド開発では Claude Code などのAIエージェントと Playwright MCP を組み合わせ、コード修正から動作確認までをPlaywrightベースで回すワークフローが選択肢として広がりつつあります。こうした背景もあり、チームでPlaywrightへの移行を進めることになりました。 本記事では、移行にあたって…
5日前

Claude Codeエージェント実践 Day 26|SQL 7本パイプラインを端から端まで通す — モックから本番コードへ
Akiraさんのフィード
TL;DRdashboard_generator.py が v2 で止まっていたことに気づき、v3/v4 の SQL 3本 + HTML セクションを一括マージしたBigQuery → Python → HTML → Chrome の全工程を通し実行し、v4 ダッシュボードが実データで表示されることを確認したAIが速く作れる快感で設計上の役割分担を忘れていた。本来は分析エージェント経由の設計なのに、人間が直接改良し続けた反省 今日のゴールDay 22〜25 で段階的に積み上げてきたダッシュボードの設計(SQL 7本・HTMLセクション追加)を、実際に動く dashb...
5日前

tldraw issue: Move tests to closed source repo Simon Willison's Weblog
<p><strong><a href="https://github.com/tldraw/tldraw/issues/8082">tldraw issue: Move tests to closed source repo</a></strong></p>It's become very apparent over the past few months that a comprehensive test suite is enough to build a completely fresh implementation of any open source library from scratch, potentially in a different language.</p><p>This has worrying implications for open source projects with commercial business models. Here's an exa...
5日前

Claude Code Remote Control Simon Willison's Weblog
<p><strong><a href="https://code.claude.com/docs/en/remote-control">Claude Code Remote Control</a></strong></p>New Claude Code feature dropped yesterday: you can now run a "remote control" session on your computer and then use the Claude Code for web interfaces (on web, iOS and native desktop app) to send prompts to that session.</p><p>It's a little bit janky right now. Initially when I tried it I got the error "Remote Control is not enabled for y...
5日前

I vibe coded my dream macOS presentation app Simon Willison's Weblog
<p>I gave a talk this weekend at Social Science FOO Camp in Mountain View. The event was a classic unconference format where anyone could present a talk without needing to propose it in advance. I grabbed a slot for a talk I titled "The State of LLMs, February 2026 edition", subtitle "It's all changed since November!". I vibe coded a custom macOS app for the presentation the night before.</p><p><img src="https://static.simonwillison.net/static/2026/state-of-llms.jpg" alt="A...
5日前

「Java to Kotlinコンバータ for VS Code」、JetBrainsがリリース
Publickey
JetBrainsは、Visual Studio Code(VS Code)の拡張機能としてJavaのコードを自動的にKotlinコードに変換する「Java to Kotlinコンバータ for VS Code」(j2k-vscode)をリ...
5日前

LibreOfficeがWebブラウザから利用できる「LibreOffice Online」開発の再始動を発表
Publickey
無料で利用可能なオフィススイート「LibreOffice」を開発しているThe Document Foundationは、Webブラウザから利用可能な「LibreOffice Online」の開発を再始動すると発表しました。 LibreOf...
5日前
2/25 (水)

Why Multi-Agent Systems Need Memory Engineering
Radar
Most multi-agent AI systems fail expensively before they fail quietly. The pattern is familiar to anyone who’s debugged one: Agent A completes a subtask and moves on. Agent B, with no visibility into A’s work, reexecutes the same operation with slightly different parameters. Agent C receives inconsistent results from both and confabulates a reconciliation. The […]
5日前

4社合同イベント!Mobile Tech Flexを開催しました!
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは!サイボウズのトニオ(@tonionagauzzi)です。普段はkintone開発チームにてAndroidアプリを主に開発しています。今回は、ディップ株式会社、株式会社Voicy、株式会社ヤプリ、そしてサイボウズ株式会社の4社合同でモバイル勉強会を開催しました。本記事では、イベントの概要と当日の様子をお届けします!イベントの概要イベント情報当日の様子LT (1) : AIとなら実現できる事業と品質のシン化の両立LT (2) : OSアップデート:年に一度の「大仕事」を乗り切るQA戦略LT (3) : "レビュー"だけだったAI活用から半年。ヤプリのiOS開発・運用はどう変化したか?LT (4) : 謎現象の解決手段を発見して プチ英雄になりましたLT (5) : Claude × Markdown で仕様書をいい感じに管理したいLT (6) : Kotlin Multiplatform + iOS アーキテクチャの実践LT (7) : バイトルiOSアプリのリアーキテクト / SwiftPMとAIルールで実現するモジュール設計懇親会まとめイベントの概要Mobile Tech
5日前

Quoting Kellan Elliott-McCrea Simon Willison's Weblog
<blockquote cite="https://laughingmeme.org/2026/02/09/code-has-always-been-the-easy-part.html"><p>It’s also reasonable for people who entered technology in the last couple of decades because it was good job, or because they enjoyed coding to look at this moment with a real feeling of loss. That feeling of loss though can be hard to understand emotionally for people my age who entered tech because we were addicted to feeling of agency it gave us. The web was objectively awful as a te...
5日前

同時接続数30万超のチャットサービスのメッセージ配信基盤をRedis Pub/SubからRedis Streamsにした話 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2023年9月5日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。Overview30万を超える同時...
6日前

3日間で技術書を書き上げる - 執筆ハッカソンイベント「Bookathon」 協賛レポート LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは、Dev Content DivisionのDiv Leadをしているmochikoです。LINEヤフー株式会社で開発者向けのドキュメントを書くテクニカルライターとして働く傍ら、個人としても...
6日前

多言語横断開発の現場から「Python と static duck typing」
KAKEHASHI Tech Blog
長い前置き おはようございます。カケハシのPE新規サービス開発チームというところでソフトウェアエンジニアをやっているogijunこと荻野です。最近この技術ブログはAIの話題が多めなので、ここから言語オタク語りが始まってしまうのはいいのか?とか思いますが、かまわず書きたいと思います。 前置きとして、わたしたちのチームではその名の通り新規事業のプロトタイプをよくやってます。その際には、なるべくサクサク実装して仮説検証を短いサイクルで回すために、社内の既にあるいろいろなプロダクト基盤を間借りしながら機能追加をさせてもらって実験を繰り返しています。 なので、気がつくと多数あるカケハシプロダクトの統一さ…
6日前

Claude Skill を Cursor の Agent Skill として使えるようにした話
Timee Product Team Blog
こんにちは!タイミーでバックエンドエンジニアとして働いている福井 (bary822) です。 皆さんは「Claude Code の Skills を社内の Cursor ユーザーも使えるようにしたい」と思ったことはないでしょうか? Claude Code には Claude Plugin という仕組みがあり、社内で共有したい Skills を簡単に配布できます。しかし、Cursor には Claude Plugin に相当する機能がなく、さらに Claude Code の Skills は独自の構文をサポートしているため、そのままでは動作しません。 この記事では、Claude Plugin 形…
6日前

Linear walkthroughs Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Sometimes it's useful to have a coding agent give you a structured walkthrough of a codebase. </p><p>Maybe it's existing code you need to get up to speed on, maybe it's your own code that you've forgotten the details of, or maybe you vibe coded the whole thing and need to understand how it actually works.</...
6日前

Disrupting malicious uses of AI | February 2026
OpenAI News
Our latest threat report examines how malicious actors combine AI models with websites and social platforms—and what it means for detection and defense.
6日前

Risky Biz Podcast: Open Source Risk Is Compounding as AI Agents Write 90% of New Code
Socket
AI agents are writing more code than ever, and that's creating new supply chain risks. Feross joins the Risky Business Podcast to break down what that means for open source security.
6日前

Claude Codeエージェント実践 Day 25|顧客ランキングと離反ワーニング — ダッシュボードに「人」を映す
Akiraさんのフィード
TL;DRトップ顧客ランキング(セグメント付き)と離反顧客ワーニングを v4 ダッシュボードに追加した離反検出は「前月購入 × 当月ゼロ」の LEFT JOIN + IS NULL パターンで実装金額だけ見ていたダッシュボードに「誰が買っているか」「誰が離れたか」の視点が加わった 今日のゴールv3 ダッシュボードに「トップ顧客ランキング」と「離反顧客ワーニング」を追加し、金額だけでなく「誰が買い、誰が離れたか」が見える v4 を完成させる。 前提条件Day 24 の v3 ダッシュボード(KPI・推移・粗利)が完成していることBigQuery に analy...
6日前

go-size-analyzer Simon Willison's Weblog
<p><strong><a href="https://github.com/Zxilly/go-size-analyzer">go-size-analyzer</a></strong></p>The Go ecosystem is <em>really</em> good at tooling. I just learned about this tool for analyzing the size of Go binaries using a pleasing treemap view of their bundled dependencies.</p><p>You can install and run the tool locally, but it's also compiled to WebAssembly and hosted at <a href="https://gsa.zxilly.dev/">gsa.zxilly.dev</...
6日前

AWS、サブエージェントごとにフロントエンド担当、バックエンド担当などカスタマイズによる高性能化が可能な「Kiro 0.9」リリース
Publickey
Amazon Web Servicesは、同社が提供するAIコードエディタの新バージョン「Kiro 0.9」のリリースを発表しました。 KiroはVisual Studio Code(VS Code)互換のコードエディタに生成AIの機能を統...
6日前
2/24 (火)

Arvind KC appointed Chief People Officer
OpenAI News
OpenAI appoints Arvind KC as Chief People Officer to help scale the company, strengthen its culture, and lead how work evolves in the age of AI.
6日前

First run the tests Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Automated tests are no longer optional when working with coding agents.</p><p>The old excuses for not writing them - that they're time consuming and expensive to constantly rewrite while a codebase is rapidly evolving - no longer hold when an agent can knock them into shape in just a few minutes.</p><...
6日前

Control Planes for Autonomous AI: Why Governance Has to Move Inside the System
Radar
For most of the past decade, AI governance lived comfortably outside the systems it was meant to regulate. Policies were written. Reviews were conducted. Models were approved. Audits happened after the fact. As long as AI behaved like a tool—producing predictions or recommendations on demand—that separation mostly worked. That assumption is breaking down. As AI […]
6日前

300行の失敗から学んだ、AIエージェントを自律駆動させるプロンプト設計5原則
Wantedly Engineer Blog
シニアエンジニアが2時間かけて回答していた工数見積もりをAIエージェントDevin(Cognition社)に任せて...
6日前

Qwen3.5-397B-A17Bのコーディングを試す。型の扱いは苦手だけど安定感がある
きしだのHatena
Qwen3.5-397B-A17BのUnsloth版Q4_K_MをMac Studio 512GBで試しています。 今回はコーディングについて。 一般性能はこちら。 Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~ - きしだのHatena コードはひととおり書けて安定感はあるけど型や精度の扱いに弱いという感じです。 日常的なコーディング作業なら問題なくこなせそう。 とくに、画像認識との組み合わせができるのも強い。 ブロック崩し ではブロック崩し。 HTML+JS まずHTML+JS版。一発完動で、修正としてパーティクルを出してもらっても問題なく動…
6日前

Qwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで21tok/secで動かす
きしだのHatena
試しにQwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで動かしてみたら、21tok/secと実用的な速度がでました。 Qwen3 Nextはアクティブ3Bなので、CPUで動かしてもそれなりの速度が出るはずです。 重いのはアテンションの処理なので、そこはGPUで動かして、FFNだけCPUに任せましょうというのが基本的な考え方。ここで詳しく解説してます。 CPUが得意なことをCPUにまかせて少ないVRAMでも大きめのLLMを速く動かす - きしだのHatena LM Studioでも8月くらいに出来るようになってました。 GPUメモリ4GBあればGPT-os…
7日前

ヘルプサイト刷新の全貌(フロントエンド除く): AWS × Terragrunt によるインフラ再構築、textlint プラグインの開発、etc
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは、ソフトウェアエンジニアの @ajfAfg です。弊社には複数のヘルプサイトが存在しますが、その一部を半年ほどで刷新しました。刷新と呼んでいますが、WOVN という多言語化用 SaaS の導入に加え、ヘルプサイトのコンテンツを作成するテクニカルライターの生産性向上を狙った取り組みも含まれていました。本稿では、刷新プロジェクトの中で私が担当した取り組みを紹介します。なお、本稿では特に断りがない場合、旧ヘルプサイトは刷新前のヘルプサイトを指し、新ヘルプサイトは刷新後のヘルプサイトを指すものとします。文脈から明らかな場合は単にヘルプサイトと書く場合もあります。目次目次背景刷新プロジェクトのスコープ刷新プロジェクトにおけるインフラのゴール旧ヘルプサイトのインフラ旧ヘルプサイトのインフラに関する技術的負債ほぼ全てのインフラが手動で構築されていたテストや監視がなかったリージョン間の意図しない差分が多かった事前調査および技術選定コンテンツ管理システム静的サイトジェネレーターホスティングサービスクラウドベンダーインフラ構築WOVN 導入WOVN 導入のモチベーションWOVN の導入方法静的サ
7日前

2026年3月の技術系イベント予定 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...
7日前

[MySQL Workbench] VISUAL EXPLAIN でインデックスの挙動を確認する LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2018年8月20日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。開発3センターでサーバサイドの開...
7日前

バックエンド開発Handbookを届けるために ― AI時代の知の高速道路を敷く
Timee Product Team Blog
こんにちは、タイミーでバックエンドのテックリードをしている新谷(@euglena1215)です。 今回は、社内向けに公開したバックエンド開発Handbookと、それをClaude CodeやCursorといったAIエージェント向けスキルとして届けることで、気づいたらHandbookを参照している状態を目指した取り組みについて紹介します。 バックエンド開発Handbookとは何か バックエンド開発Handbookは、タイミーのバックエンド開発における設計・実装・運用のガイドラインをまとめたドキュメント集です。GitHub Pages でホスティングし、開発者が見やすい形で公開しています。 タイミ…
7日前

Vol. 06 「その機能、本当に“今”必要ですか?」チームで挑んだ引き算と加速
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第6弾です!こんにちは!Sansan Data Intelligenceのプロダクトマネジャー(PdM)の家後佑美です。 今回のブログリレーでは、エンジニアのメンバーがそれぞれの専門性を活かした技術的なトピックを綴っています。私はPdMという立場から、エンジニアやデザイナーと共に、職能の境界を超えてプロダクトを研ぎ澄ませていった裏側を、少し違う角度から書かせてもらおうと思います。
7日前

Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~
きしだのHatena
Qwen3.5-397B-A17Bを手元で試してみました。 397Bで、アクティブ17BのMoEモデルでライセンスはApache 2.0です。 Qwen3.5-397B-A17Bは、Qwen3-Nextと同様にGated DeltaNetworkを使った線形アテンションなモデルです。なのでちょっと不安があったけど、かなりいい感じ。 Qwen3-Nextが2025年9月リリースだったことを考えると、その知見を活かしながら、ある程度並行で開発を行ったんじゃなかろうか。 Mac Studio 512GBでLM Studio、UnslothさんのところのQ4_K_Mを使って試します。 unsloth/…
7日前

Claude Codeエージェント実践 Day 24|ドーナツチャートと予算比KPI — ダッシュボード v3 で粗利を語る
Akiraさんのフィード
TL;DR予算テーブル(analytics.budget)を新設し、KPIカードを「売上実績」→「予算達成率+粗利」に進化させた月次推移を売上+粗利の 2本折れ線、カテゴリ別粗利を ドーナツチャート(Canvas API) で新規実装v3 ダッシュボードは「売上だけ」から「利益と予算が見える」状態になり、SQL は 4本 → 5本に増えた 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予定) v3 ダッシュボードv2 と比べると情報量が段違い。「売上がいくらか」ではなく「利益がど...
7日前

Ladybird adopts Rust, with help from AI
Simon Willison's Weblog
<p><strong><a href="https://ladybird.org/posts/adopting-rust/">Ladybird adopts Rust, with help from AI</a></strong></p>Really interesting case-study from Andreas Kling on advanced, sophisticated use of coding agents for ambitious coding projects with critical code. After a few years hoping Swift's platform support outside of the Apple ecosystem would mature they switched tracks to Rust their memory-safe language of choice, starting with an AI-assisted port of...
7日前

Writing about Agentic Engineering Patterns Simon Willison's Weblog
<p>I've started a new project to collect and document <strong><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a></strong> - coding practices and patterns to help get the best results out of this new era of coding agent development we find ourselves entering.</p><p>I'm using <strong>Agentic Engineering</strong> to refer to building software using coding agents - tools like Claude Code and...
7日前

Four Malicious NuGet Packages Target ASP.NET Developers With JIT Hooking and Credential Exfiltration
Socket
Socket uncovered four malicious NuGet packages targeting ASP.NET apps, using a typosquatted dropper and localhost proxy to steal Identity data and backdoor apps.
7日前

Writing code is cheap now Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>The biggest challenge in adopting agentic engineering practices is getting comfortable with the consequences of the fact that <em>writing code is cheap now</em>.</p><p>Code has always been expensive. Producing a few hundred lines of clean, tested code takes most software developers a full day or mo...
7日前

NIST(米国国立標準技術研究所)がAIエージェントの技術標準を作る取り組み「AI Agent Standards Initiative」発表。相互運用可能かつ安全なイノベーションのために
Publickey
米国商務省傘下のNIST(National Institute of Standards and Technology:米国国立標準技術研究所)は、AIエージェントの技術標準策定に取り組む「AI Agent Standards Initia...
7日前

Quoting Paul Ford Simon Willison's Weblog
<blockquote cite="https://ftrain.com/leading-thoughts"><p>The paper asked me to explain vibe coding, and I did so, because I think something big is coming there, and I'm deep in, and I worry that normal people are not able to see it and I want them to be prepared. But people can't just read something and hate you quietly; they can't see that you have provided them with a utility or a warning; they need their screech. You are distributed to millions of people, and become the local pr...
7日前










