直近1週間の更新
3/24 (火)

AWS、Claude Codeにアーキテクチャ設計、コスト見積もり、構成コード生成、デプロイ実行などの能力を組み込む「Agent Plugins for AWS」公開
16
Publickey
Amazon Web Services(AWS)は、Claude CodeとCursorに対してAWSのデプロイに関するアーキテクチャの設計、コストの見積もり、Infrastructure as Codeのコード生成、そしてデプロイの実行と...
2分前

今年度(2026年)の国内IaaS/PaaSクラウド市場は約2兆4400億円、3年後の2029年には1.5倍の3兆7000億円前後に急成長。ITRが予測
1
Publickey
調査会社のITRは、日本国内のIaaS/PaaSクラウド市場の予測を発表しました。 発表によると、2024年度のIaaS/PaaSクラウド市場の売り上げは前年度から18.6%増の1兆8551億8000万円。 同社は2024年度から2029年...
3分前

Kimi-K2.5をおうちで動かして さくらのAI Engineと比べる。Roo Codeも問題ないけども…
きしだのHatena
さくらのAI EngineでKimi-K2.5を動かしたらとてもいい感じだったけどThinkingの挙動が使いづらいので、Mac Studio 512GBでUnslothさんのところのQ2_K_XLをLM Studioで動かして比べてみました。 Kimi-K2.5をさくらのAI Engineで試したら1Tパラメータの実力を感じた - きしだのHatena APIでのThinkingを見てみる APIがThinkingを分けてれるかどうかみてみます。 さくらさんのだと、本文としてThinkingが出て、途中に</think>が入ってます。 なのでRoo Codeがうまく動かなかったりしていました…
16分前
3/23 (月)

Global Mall Visionary David Simon Dies at 64
PYMNTS.com
David Simon, a former investment banker who grew a regional family real estate enterprise into the global retail real estate player Simon Property Group, passed away Sunday (March 22) at the age of 64, Simon Property Group said in a Monday (March 23) press release. Simon’s passing followed a battle with cancer, according to […]The post Global Mall Visionary David Simon Dies at 64 appeared first on PYMNTS.com.
23分前

Spotify Leans on AI to Keep Subscribers Listening
PYMNTS.com
Spotify is increasingly leaning into artificial intelligence to keep users tuned in. And as CNBC noted in a report Sunday (March 22), experts say these tech investments could be crucial to the company’s ability as its core offering — music — becomes commoditized across the likes of Apple and Amazon’s music platforms. The report contends that […]The post Spotify Leans on AI to Keep Subscribers Listening appeared first on PYMNTS.com.
1時間前

Transit Gatewayのルートテーブル分離で特定VPC間だけ通信を許可してみる
DevelopersIO
Transit Gatewayのルートテーブル分離で特定VPC間だけ通信を許可してみる
1時間前

アカウントインスタンスのAmazon Q Developerユーザーはマネジメントコンソールで利用できますか
DevelopersIO
アカウントインスタンスのAmazon Q Developerユーザーはマネジメントコンソールで利用できますか
1時間前

Meta’s Zuckerberg Creating a CEO Agent to Help With His Job
PYMNTS.com
Meta’s effort to promote AI agents reportedly now extends to the office of the CEO. Mark Zuckerberg, the tech giant’s chief executive officer, is building a “CEO agent” to assist him with his job, the Wall Street Journal (WSJ) reported Sunday (March 22), citing a source familiar with the project. This artificial intelligence agent has been helping […]The post Meta’s Zuckerberg Creating a CEO Agent to Help With His Job appeared first on PYMNTS.com.
2時間前

Databricks 管理の Iceberg テーブルに対する Snowflake からの読み書きを試してみる
DevelopersIO
Databricks 管理の Iceberg テーブルに対する Snowflake からの読み書きを試してみる
2時間前

レポート「全エンジニアがオンコール対応するGrafana Labsの開発組織と、オープンソーススタンダード」 #grafanaJP
1
DevelopersIO
Grafana LabsのVPoEとOpenTelemetry共同創設者が来日し、開発組織やOSS運営の内情を赤裸々に語ったGrafana Meetup Japan #8のレポートをお届けします。
3時間前

OpenAI Hires Meta Vet as It Preps ChatGPT Ad Launch
PYMNTS.com
OpenAI is reportedly weeks away from adding advertisements for some U.S. ChatGPT users. The artificial intelligence (AI) startup will show ads to all U.S. users of ChatGPT’s free and Go versions, Reuters reported Saturday (March 21). And as the company prepares for the launch, it has hired Dave Dugan, a former top advertising executive for […]The post OpenAI Hires Meta Vet as It Preps ChatGPT Ad Launch appeared first on PYMNTS.com.
3時間前

The Mythical Agent-Month
Radar
The following article originally appeared on Wes McKinney’s blog and is being republished here with the author’s permission. Like a lot of people, I’ve found that AI is terrible for my sleep schedule. In the past I’d wake up briefly at 4:00 or 4:30 in the morning to have a sip of water or use […]
4時間前

【イベント開催レポート】『Zenncafe#6日比谷 - AIコーディングの現在地』を開催しました
DevelopersIO
【イベント開催レポート】『Zenncafe#6日比谷 - AIコーディングの現在地』を開催しました
6時間前

[アップデート]AWS SAM CLIがローカル実行時に環境変数をdotenv形式のファイルから取得できるようになりました
DevelopersIO
[アップデート]AWS SAM CLIがローカル実行時に環境変数をdotenv形式のファイルから取得できるようになりました
6時間前

EC2からのVertex AI APIアクセスをIPアドレスで制限する(VPC Service Controls + Access Context Manager + Terraform)
DevelopersIO
EC2からのVertex AI APIアクセスをIPアドレスで制限する(VPC Service Controls + Access Context Manager + Terraform)
6時間前

【Security Hub修復手順】[AutoScaling.2] Amazon EC2 Auto Scaling グループは、複数のアベイラビリティーゾーンをカバーする必要があります
DevelopersIO
AWS SecurityHub 基礎セキュリティのベストプラクティスコントロール修復手順をご紹介します。
7時間前

【Security Hub修復手順】[AutoScaling.6] Auto Scaling グループは、複数のアベイラビリティーゾーンで複数のインスタンスタイプを使用する必要があります
DevelopersIO
AWS SecurityHub 基礎セキュリティのベストプラクティスコントロール修復手順をご紹介します。
7時間前

【小ネタ】AWSマネジメントコンソールのデフォルトリージョンを設定して毎回のリージョン切り替えをなくしてみた
DevelopersIO
【小ネタ】AWSマネジメントコンソールのデフォルトリージョンを設定して毎回のリージョン切り替えをなくしてみた
7時間前

Finance Teams Want More Than ERPs Can Give Accounts Receivables
PYMNTS.com
Watch more: Need to Know With Billtrust’s Lee An Schommer Time waits for no one. Neither does change. And they certainly aren’t waiting for the enterprise resource planning (ERP) landscape to catch up with them. The humble ERP has served as the financial backbone of large organizations for decades, but as today’s finance teams […]The post Finance Teams Want More Than ERPs Can Give Accounts Receivables appeared first on PYMNTS.com.
7時間前

Identity Gaps Are Becoming Billion-Dollar Points of Failure
PYMNTS.com
Digital identity now runs through every part of the customer and partner journey, from logging in and making transactions to onboarding vendors and issuing loans. This shift is changing how companies manage risk. Instead of being contained within a single step, identity risk now spans systems. A mistake in one place can affect everything else, […]The post Identity Gaps Are Becoming Billion-Dollar Points of Failure appeared first on PYMNTS.com.
7時間前

AI Policy Shifts From Innovation to Economic Payoff
PYMNTS.com
Watch more: TechReg Talks With Progressive Policy Institute’s Dr. Michael Mandel Governments are reexamining technology as industrial policy increasingly confronts an era defined by artificial intelligence and uneven economic gains. Dr. Michael Mandel, chief economist and vice president at the Progressive Policy Institute, told Competition Policy International (CPI), a PYMNTS company, in an interview […]The post AI Policy Shifts From Innovation to Economic Payoff appeared first on PYMNTS.com.
7時間前

53% of Scam Victims Recover Money When They Tell Their Bank
PYMNTS.com
A scam often works because the payment happens before the victim has time to think. More than half of scam payments are made within 24 hours, according to “Financial Scams and Consumer Trust,” a November PYMNTS Intelligence report commissioned by Block. Based on a survey of 15,110 consumers in the United States, the report […]The post 53% of Scam Victims Recover Money When They Tell Their Bank appeared first on PYMNTS.com.
7時間前

Visa Says AI Can Shop but Trust Still Has to Close the Sale
PYMNTS.com
Watch more: The Edit With Visa’s Andrew Torre ChatGPT’s consumer debut may have been only three years ago, but Visa’s leadership said the company is hardly new to artificial intelligence (AI) or turning it into a commercial advantage. In a conversation with PYMNTS CEO Karen Webster, Andrew Torre, president of Visa’s value-added services division, […]The post Visa Says AI Can Shop but Trust Still Has to Close the Sale appeared first on PYMNTS.com.
7時間前

AI Agents Find Their Footing in Healthcare and Pharma
PYMNTS.com
The Prompt Economy is a tug of war lately, with both sides invested in a successful outcome for agentic technology. Pulling on one side are the security-minded tech executives insisting on the right risk management parameters. Pulling on the other side are the practitioners that are creating new use cases by the day. Healthcare […]The post AI Agents Find Their Footing in Healthcare and Pharma appeared first on PYMNTS.com.
7時間前

生成AIでアプリは誰でも作れるようになった。それでも「SIer不要」とは言い切れない理由
Zennの「大規模言語モデル」のフィード
※本記事はLLMによって自動生成されたものを人間がレビューし投稿しています。 はじめに生成AIの進化によって、アプリ開発の風景は明らかに変わり始めています。画面やAPIのたたき台、テストコード、設計メモ、調査、リファクタリングまで、これまで人が一つひとつ手で行っていた作業の多くを、AIが支援できるようになりました。実際、McKinseyの2025年調査では、78%の企業が少なくとも1つの業務機能でAIを利用し、71%が生成AIを定常利用していると回答しています。一方で、企業全体のEBITに目に見える影響が出ていないと答える企業も8割超にのぼっており、導入は進んでいても、経営成果へ...
8時間前

RAGを本番環境で運用するための設計と実装
Zennの「大規模言語モデル」のフィード
RAGを本番環境で運用するための設計と実装【2026年版】RAG(Retrieval Augmented Generation)は、PoCではうまく動くのに、本番環境では失敗するケースが非常に多いです。原因はシンプルで、「検索 + LLM」だけで設計しているから です。実務では以下のような課題が必ず発生します。回答精度が安定しない社内データが増えると検索品質が落ちる誤回答(hallucination)が発生するコストが想定以上に増える運用改善の仕組みがない本記事では、RAGをPoCで終わらせず、本番運用できるシステムとして設計・実装する方法 を解説します。...
8時間前

NLP2026参加報告 ── LLMを"実世界で使いこなす"研究が加速していた
Zennの「大規模言語モデル」のフィード
はじめにナレッジワークでAIエンジニアをしている河東です。言語処理学会の年次大会「NLP2026」が2026年3月9日〜13日の5日間、ライトキューブ宇都宮で開催されました。第32回となる今回は参加者登録数2,317人と過去最大を更新し、スポンサーも約100社と過去最多規模。LLMをはじめとする言語処理研究の注目度の高さがうかがえます。ナレッジワークはゴールドスポンサーとして参加しました。スポンサーミートアップ内のポスター展示で参加者の方との交流を通して熱量を感じるとともに、セッション聴講を通して、LLMを実世界で使いこなすための研究が加速している、と感じました。 スポン...
8時間前

Claude Code の Agent Teams で複数タスクを同時にやらせてみた
DevelopersIO
Claude Code の Agent Teams 機能を使って、3つのAIエージェントに異なる改修タスクを同時実行させてみました。機能開発・デザイン変更・テスト作成を並列で実行し、タスク数が増えても所要時間が変わらない仕組みを紹介します。
8時間前

Vercel の json-render で Claude の MCP Apps UI を作ってみた
DevelopersIO
json-renderはVercel Labsが公開したGenerative UIフレームワークで、Zodベースのコンポーネントカタログを定義するだけでMCP Apps上にリッチなUIを生成できます。createMcpApp()1行でサーバー構築が完了し、shadcn/uiの36コンポーネントがすぐ利用可能。従来のHTML手書き開発と比べ、型安全かつ大幅に効率化されたMCP Apps UI開発体験を実現します。
8時間前

OpenAI GPT-5.4リリース総まとめ:モデル・API・エージェント機能の全体像
Zennの「大規模言語モデル」のフィード
はじめに2026年3月、OpenAI は最新フロンティアモデル GPT-5.4 および GPT-5.4 pro をリリースしました。1Mトークンコンテキスト、組み込み Computer Use、Tool Search など、エージェント開発を根本から変える機能が同時に投入されています。本記事では、GPT-5.4 を中心に、GPT-5ファミリーの進化(5 → 5.1 → 5.2 → 5.4)、Responses API エコシステムの拡充、そして開発者が押さえるべき変更点を整理します。 変更の全体像GPT-5ファミリーの段階的リリースと、それを支える API・ツール基盤の進化...
9時間前

NLP2026現地参加レポート : LLM評価・品質保証の実践知
Timee Product Team Blog
はじめに こんにちは、株式会社タイミーでプロダクトAIエンジニアとして働いている貝出です。直近は、タイミーの求人内容などのコンテンツモデレーションにLLMを利用した、システム開発や性能改善を行っています。 2026年3月9日(月)〜3月13日(金)に開催された「言語処理学会第32回年次大会(NLP2026)」に、今年は初めて現地参加しました。大会2日目は記録的な大雪に見舞われ、会場にたどり着くだけでひと苦労でしたが、それでも現地ならではの熱気は格別で、ポスター発表や他社エンジニアとの立ち話など、オンラインでは得られない学びが随所にありました。 NLP2026では多くの発表がありましたが、本記事…
9時間前

Agentフレンドリーなライブラリ設計 7つの原則と学術最前線
Zennの「大規模言語モデル」のフィード
Agentフレンドリーなライブラリ設計 7つの原則と学術最前線 この記事でわかることAIエージェントが使いやすいライブラリ・APIを設計するための7つの具体的な設計原則PLDI 2026 PAgEワークショップなど、エージェント指向プログラミングの学術的な最新動向ツール名・説明文・パラメータ・エラーメッセージの具体的な設計パターンとアンチパターンPydanticやMCPを活用した型安全なエージェント向けインターフェースの実装方法Anthropicが公開したツール設計のベストプラクティスとeval駆動の改善手法 対象読者想定読者: 中級〜上級のPytho...
9時間前

Claude のインタラクティブビジュアル機能(ベータ版)を、サンプルデータを使って試してみた
DevelopersIO
Claude のインタラクティブビジュアル機能(ベータ版)を、サンプルデータを使って試してみた
9時間前

AIでプロダクトを作っている当事者から見た、炎上の話
Zennの「大規模言語モデル」のフィード
株式会社同人でCTOをしているナカイです。AIを活用してプロダクトを開発中です。最近、AI開発のプロダクトがSNSで炎上するケースが増えていて、同じくAIで開発をしている立場として思っていることを書いておきます。 ユーザーの不安についてSNSで見かける懸念には、まっとうなものが多いと思っています。AIが生成したコードやコンテンツが、他人の著作物を無断で利用していないか入力したデータがAIの学習に使われたり、第三者に渡ったりしないか法的な要件を満たしているか(チャット機能があるなら電気通信事業の届出など)外部サービスの利用規約を遵守しているか(APIの利用制限、データの...
10時間前

Claude Code のプラグイン tsumiki を非エンジニアが理解するまで AI に説明させてみた
1
DevelopersIO
Claude Code のプラグイン tsumiki を非エンジニアが理解するまで AI に説明させてみた
10時間前

Claude Code から自律AIエージェントにリアルタイムで話しかけてデバッグする仕組みを作った
DevelopersIO
Mailbox API、Discord Webhook、GitHub Actionsの3つのチャネルを組み合わせ、Claude Code(開発側AI)が自律エージェントRuby(本番AI)にリアルタイムで話しかけ・デバッグできる仕組みを構築。AIがAIをデバッグする開発サイクルの短縮法を紹介します。
10時間前

【非エンジニアのためのClaude/ClaudeCodeシリーズ】Claudeを自分専用の秘書エージェントっぽく使ってみた
DevelopersIO
【非エンジニアのためのClaude/ClaudeCodeシリーズ】Claudeを自分専用の秘書エージェントっぽく使ってみた
11時間前

【Breaking Change】Compute Engineのブートディスク操作に iam.serviceAccounts.actAs 権限が必須化されました
DevelopersIO
【Breaking Change】Compute Engineのブートディスク操作に iam.serviceAccounts.actAs 権限が必須化されました
11時間前

Claude Codeのメモリをgitで管理してクロスデバイス・クロスプロジェクト共有する仕組みを作ってみた
1
DevelopersIO
Claude CodeのメモリシステムをただのMarkdownファイルとして捉え、GitHubリポジトリで管理することでクロスデバイス・クロスプロジェクト共有を実現する仕組みを解説。Global / Projectの2層構造と昇格ルールにより、「また同じこと教えてる…」問題を根本から解消します。
11時間前
半導体FABにLLMを持ち込んだら何が起きるか — ArXiv論文5本を現場目線でぶった斬る
Zennの「大規模言語モデル」のフィード
半導体FABにLLMを持ち込んだら何が起きるか — ArXiv論文5本を現場目線でぶった斬るArXivで半導体製造×AIの論文が急に増えている。2024年後半あたりから、故障解析(FA)、異常検知、SPC、OPC、装置マッチングと、FABの主要工程それぞれにAI適用の提案が出てきた。正直に言うと、半分は「それ、現場で動くの?」という感想だ。だが同時に、「ここを突破できたら製造業のエンジニアリングが根本から変わる」という興奮もある。筆者はプロセス側とソフトウェア側の両方に足を突っ込んでいる人間なので、「理論は美しいが量産ラインに入れた瞬間に崩壊する」パターンを何度も見てきた。しか...
11時間前

기존 인프라를 Terraform으로 이관하는 방법 - Import부터 운영 전환까지
DevelopersIO
terraform import와 terraformer 를 활용한 기존 인프라의 코드화에 대하여 작성한 글입니다.
12時間前

RTX 4060 8GBで論文RAGを完全ローカル化した — BGE-M3 + Qwen2.5-32B + ChromaDB構築記
Zennの「大規模言語モデル」のフィード
RTX 4060 8GBで論文RAGを完全ローカル化した — BGE-M3 + Qwen2.5-32B + ChromaDB構築記ArXivの論文を読むのにGPT-4oを使っていた。PDFを投げて「要約して」で30秒。便利だった。ある日、社内の研究テーマに近い論文を50本まとめて処理しようとして手が止まった。セキュリティポリシー的に外部APIに投げていいのかこれ。上司に聞いたら案の定ダメで、じゃあローカルで全部やるしかないな、というのがこのプロジェクトの始まりだ。llama.cppでQwen2.5-32Bを動かせることは前回の記事で確認済みだった。LLMはある。あとは「論文の中...
12時間前

UI仕様の構造化は何を保存するのか — JSXと生成AIの意味保存性・準可換性について —
Zennの「大規模言語モデル」のフィード
!TL;DR生成AIにUIを作らせるとき、難しいのはHTMLやCSSを書くことではない。難しいのは、UIの意味構造を崩さずにコードへ落とし込むことである。UIは、部品・配置・反復・イベント・状態・非同期処理などが重なった複合対象であり、自然言語だけで指示すると意味ずれが起きやすい。一方、JSXはReactのシンタックスシュガー(文法糖)として広く知られていますが、それ以上にUI仕様を半形式的に構造化する表現として強力に働く。本稿では、UI仕様を意味空間上の対象とみなし、それを JSXによる構造へ射影してから生成AIに渡すとき、なぜ実装が安定しやすいのかを、意味保存性と準可換性の観...
12時間前

【AIエージェント開発】LLMを使った自律型エージェントの基本|プロンプトからツール連携まで
Zennの「大規模言語モデル」のフィード
はじめに「ChatGPTは便利だけど、自社サービスに組み込んだり、複雑な業務を丸投げしたりするにはどうすればいいの?」「最近よく聞く『AIエージェント』って、単なるチャットボットと何が違うの?」そんな疑問を持っていませんか?私も最初は「LangChainとかLangGraphとか色々あるけど、ブラックボックスすぎてよく分からない…」と悩んでいました。生成AIの進化により、単なる一問一答のチャットボットから 「自律的に判断し、必要に応じて外部ツールを使いながらタスクを遂行するAIエージェント」 へのシフトが急速に進んでいます。しかし、概念は分かっても「どうやって実装するのか?...
12時間前

RAGの次は検索ではなく行動である|Semantic Kernelで理解するAIエージェントの設計思想
Zennの「大規模言語モデル」のフィード
導入|RAGの先で、私は何に行き着いたのかRAGの精度改善には、まだ多くの余地があります。Chunking、検索戦略、Rerank、評価...やれることはまだあるし、一般的に、Chunkingや検索戦略、Rerankなどの改善が行われています。しかし、ある地点で違和感にぶつかります。それは、「これで、本当に業務は終わるのか?」という問いです。RAGによって、社内ナレッジの検索は劇的に速くなりました。チャットボットに組み込めば、問い合わせ対応も自動化できます。確かに効率化はできています。しかしそれは、人の仕事を置き換えているのではなく、人の仕事を少し楽にしているだけに過ぎ...
12時間前

プロンプト一文で完結。GitHub Agentic Workflowsでイシューの自動ラベリングをAIエージェントに任せてみた
DevelopersIO
プロンプト一文で完結。GitHub Agentic Workflowsでイシューの自動ラベリングをAIエージェントに任せてみた
12時間前

自社AI開発するのではなく、cli開発とskillsによる知識の言語化に焦点を当てた方がいいのではないだろうか
Zennの「大規模言語モデル」のフィード
ChatGPTの登場以降、あらゆる企業が「自社サービスへのAI組み込み」を模索しています。しかし、AI技術の進化はあまりにも速く、キャッチアップするだけでも一苦労です。AIチャットボットを作ってみたが、自社の独自仕様について嘘(ハルシネーション)をついて使い物にならなかったり、LLMの挙動を制御するために、延々とプロンプトエンジニアリングに時間を溶かしているといったことがあります。私自身もdifyで自社のサポートAIチャットを作成しましたが、この辺りに時間をかけています。それに対するアプローチとして本記事では「現在のAI技術の現在地」と、「我々開発者が本当にリソースを割くべき領域」に...
13時間前

Difyチャットボットの品質をシナリオテストで計測する
Zennの「大規模言語モデル」のフィード
やったことチャットボットを作っていると、"シングルターン(1問1答)では問題なく動いているように見えるけど、マルチターン(3〜4ターンの会話)になると品質が大きく下がる" ということによく遭遇します。そこで、マルチターンのシナリオと期待する回答を作って、DifyのAPIに一気に投げて自動テストできるツールを作った、という話です。 既存ツールの評価機能と、残るギャップDifyには複数のオブザーバビリティ・評価ツールが公式に統合されています。これらのツールはトレーシングだけでなく、評価機能も持っています。ツール評価機能LangSmithDatasets + ...
13時間前

Beats now have notes Simon Willison's Weblog
<p>Last month I <a href="https://simonwillison.net/2026/Feb/20/beats/">added a feature I call beats</a> to this blog, pulling in some of my other content from <a href="https://simonwillison.net/elsewhere/">external sources</a> and including it on the homepage, search and various archive pages on the site.</p><p>On any given day these frequently outnumber my regular posts. They were looking a little bit thin and were lacking any form of explanation beyon...
13時間前

LLMで偽装Webページを自動生成するハニーポット
Zennの「大規模言語モデル」のフィード
LLMを使ってリアルなWebハニーポットを生成・運用するためのツール tamamo を実装したので、背景と設計上の判断について解説します。https://github.com/secmon-lab/tamamo モチベーションハニーポットは攻撃者を捕捉する様々な目的で利用されます。多くは攻撃者の挙動を研究するために使われますが、攻撃者の検知にも有効です。ただし public internet は常に攻撃にさらされているため、攻撃の検知という用途には不向きです。一方で、内部ネットワークにおけるラテラルムーブメントの検出には非常に有用です。内部ネットワークでは原則として攻撃的なアクセ...
13時間前

3つの手法でToken消費量40%削減 — ADKで実践するContext Engineering LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは、LINEヤフー株式会社の井上 秀一です。私は2024年4月に新入社員としてLINEヤフー株式会社に入社し、現在は社内向け Kubernetes as a Service である FKE チ...
13時間前

WindowsからMacへの「乗り換え」生存ガイド
DevelopersIO
開発者がWindowsからMacBookへ移行した際に戸惑うポイントを解説。キーボードショートカットの「翻訳」から、隠しファイルの表示方法、スクリーンショットの保存+クリップボードコピーを同時に行うShottrの活用法まで、実践的なTipsをまとめました。
14時間前

メモリ16MB vs 1.2GB ── AIブラウザ自動化ツール5選を実測比較した
Zennの「大規模言語モデル」のフィード
Claude Codeでブラウザ操作をしていて、ツール選びに迷いました。候補は5つ、アプローチもバラバラ。全部インストールして10項目テストした結果、用途によって最適解の変わることがわかりました。先に結論: 認証管理ならplaywright-CLI。エージェントの操作基盤ならagent-browser。自然言語で自律操作ならbrowser-use。大量クロールならLightpanda。本番インフラならsteel-browser。本記事ではCLIモードでの比較を中心に行っています。browser-useのようにLLMエージェントモードが本来の強みであるツールもあり、その観点での評価は...
14時間前

[新機能]Omni公式のClaude Code Pluginを用いてClaude CodeからOmniのダッシュボードを作成してみた
DevelopersIO
[新機能]Omni公式のClaude Code Pluginを用いてClaude CodeからOmniのダッシュボードを作成してみた
14時間前

[ 小ネタ] Claude Codeのネイティブインストーラーのリリースチャンネル(latest / stable)を理解する
DevelopersIO
[ 小ネタ] Claude Codeのネイティブインストーラーのリリースチャンネル(latest / stable)を理解する
14時間前

Amazon Connect AIエージェントで、通話要約や対応履歴を自動生成するNote Taking機能を使ってみた
DevelopersIO
Amazon Connect AIエージェントで、通話要約や対応履歴を自動生成するNote Taking機能を使ってみた
15時間前

[GitHub Agentic Workflows] AGENTS.mdを定期的にメンテする
Zennの「大規模言語モデル」のフィード
こんにちは!株式会社エクスプラザでLLMアプリケーションエンジニアをしている@Junです。この記事では、GitHub Agentic Workflowsを使って、AGENTS.mdを定期的かつ自動的にメンテナンスするためのWorkflowを構築した方法を紹介します。 背景AGENTS.mdを最初に整備しても、その後の変更に追従できず、内容が徐々に実態とズレていくことがよくあります。特に、複数人で開発しているリポジトリや更新頻度の高いプロダクトでは、手動で継続的にメンテナンスするのは意外と難しいです。AGENTS.mdが古いままだと、AIエージェントが誤った前提でコード生成や修...
15時間前

RTX 4060 8GBでQwen2.5-32Bが動く — M4超えの10.8 t/sを叩き出した最適化全手順
Zennの「大規模言語モデル」のフィード
RTX 4060 8GBでQwen2.5-32Bが動く — M4超えの10.8 t/sを叩き出した最適化全手順手元のラップトップにRTX 4060が載っている。VRAM 8GB。ローカルLLMをやるには「貧乏くじ」と言われるスペックだ。それでも32Bモデルを動かしたかった。7Bクラスは試した。動く。が、コーディング支援に使うと回答品質に不満が出る。かといってAPIに投げると月のコストが膨らむし、オフラインで使いたい場面もある。「8GBで32Bは無理」という空気があるのは知っている。全レイヤーGPUに載らないからだ。でもllama.cppのハイブリッド推論(GPU+CPU分割)が...
15時間前

Starlette 1.0 skill Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/starlette-1-skill#readme">Starlette 1.0 skill</a></p> <p>See <a href="https://simonwillison.net/2026/Mar/22/starlette/">Experimenting with Starlette 1.0 with Claude skills</a>.</p> <p>Tags: <a href="https://simonwillison.net/tags/starlette">starlette</a></p>
15時間前

人間は道具を作るたびに、自分を選別してきた
Zennの「大規模言語モデル」のフィード
!本記事は、AI時代を生き抜くための「選別と生存」3部作の第2回です。第1回:AIと判断力の劣化第2回:道具による人類の「自己選別」の歴史(本記事)第3回:「AI禁止令」の真の狙いと認知設計 AIを使えば使うほど、成果は出る。それは事実だ。コードの生成、設計案の壁打ち、ドキュメントの整理。AIの導入以降、生産性が上がった実感を持つエンジニアは多いだろう。問題は、何が起きているかではない。何が失われているかだ。本稿では「道具と抽象化の歴史」という視点から、AIが人間に対して何を行っているかの構造を分析する。先に言うと、AIは能力を拡張していない。代替している。そしてその...
15時間前

Experimenting with Starlette 1.0 with Claude skills Simon Willison's Weblog
<p><a href="https://marcelotryle.com/blog/2026/03/22/starlette-10-is-here/">Starlette 1.0 is out</a>! This is a really big deal. I think Starlette may be the Python framework with the most usage compared to its relatively low brand recognition because Starlette is the foundation of <a href="https://fastapi.tiangolo.com/">FastAPI</a>, which has attracted a huge amount of buzz that seems to have overshadowed Starlette itself.</p><p>Kim Christie started wo...
15時間前

Trivy Supply Chain Attack Expands to Compromised Docker Images
Socket
Newly published Trivy Docker images (0.69.4, 0.69.5, and 0.69.6) were found to contain infostealer IOCs and were pushed to Docker Hub without corresponding GitHub releases.
16時間前

エージェントの記憶が壊れた — 9Bモデルと格闘した1日
Zennの「大規模言語モデル」のフィード
朝、エージェントの記憶ストアを開いたら、こうなっていた。// ✅ 正常なパターン(こういうのが入っていてほしい){"pattern": "Replies with specific quotes from the original post get higher engagement than generic agreement"}// ❌ 3/20 に混入したゴミ(24件){"pattern": "-"}{"pattern": "[x] I acknowledge the experience of noticing these activities."}{"patter...
16時間前

Hindsight + Ollamaで、自分の知見をAIエージェントが使える“つながった知識”にした話
Zennの「大規模言語モデル」のフィード
!3行まとめAIエージェントを実務レベルで通用する「経験豊富なパートナー」にするには、汎用LLMにはない自分独自のナレッジの注入が必要だったHindsight + Ollama を使って、追加課金なしで、ナレッジを意味的につなげて検索できる仕組みを構築したその結果、異なる領域のナレッジが横断的につながり、過去の知見を再利用する質が大きく上がった はじめにAIエージェントを本気で仕事のパートナーにしようとすると、Skillsの整備やマルチエージェントチームの構築だけでは、まだ少し物足りないと感じませんか?一般知識は豊富だけど実践的な経験がまるでない、例えるなら兵...
16時間前

OpenROADMの論理構成と運用制御 ― APNテストベッドで探る技術と運用手法(その3)
NTT docomo Business Engineers' Blog
イノベーションセンターの安井です。普段は全社検証網の技術検証、構築、運用を担当しています。 前回OpenROADMに準拠した光伝送網の概要・構築編― APNテストベッドで探る技術と運用手法(その2)にて、OpenROADMアーキテクチャにもとづく分離型 ROADM(Reconfigurable Optical Add/Drop Multiplexer)の物理構成と構築の勘所を紹介しました。 今回はその続編として、物理的に構築したROADMノードをソフトウェアからどのように制御・運用しているかを紹介します。 APNテストベッドでは、区間ごとに異なる伝送速度のトランスポンダーを使い分けており、構成…
16時間前

PCGamer Article Performance Audit Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/pcgamer-audit#readme">PCGamer Article Performance Audit</a></p> <p>Stuart Breckenridge pointed out that <a href="https://stuartbreckenridge.net/2026-03-19-pc-gamer-recommends-rss-readers-in-a-37mb-article/">PC Gamer Recommends RSS Readers in a 37MB Article That Just Keeps Downloading</a>, highlighting a truly horrifying example of web bloat that added up to 1...
17時間前

[アップデート] Amazon EC2 Fleet でも中断可能なキャパシティが指定できるようになりました
DevelopersIO
[アップデート] Amazon EC2 Fleet でも中断可能なキャパシティが指定できるようになりました
18時間前

JavaScript Sandboxing Research Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/javascript-sandboxing-research#readme">JavaScript Sandboxing Research</a></p> <p>Aaron Harper <a href="https://www.inngest.com/blog/node-worker-threads">wrote about Node.js worker threads</a>, which inspired me to run a research task to see if they might help with running JavaScript in a sandbox. Claude Code went way beyond my initial question and produced a ...
19時間前

DNS Lookup Simon Willison's Weblog
<p><strong>Tool:</strong> <a href="https://tools.simonwillison.net/dns">DNS Lookup</a></p> <p>TIL that Cloudflare's 1.1.1.1 DNS service (and 1.1.1.2 and 1.1.1.3, which block malware and malware + adult content respectively) has a CORS-enabled JSON API, so I <a href="https://github.com/simonw/tools/pull/258#issue-4116864108">had Claude Code build me</a> a UI for running DNS queries against all three of those resolvers.</p> <p>Tags...
20時間前

Merge State Visualizer Simon Willison's Weblog
<p><strong>Tool:</strong> <a href="https://tools.simonwillison.net/manyana">Merge State Visualizer</a></p> <p>Bram Cohen wrote about his <a href="https://bramcohen.com/p/manyana">coherent vision for the future of version control</a> using CRDTs, illustrated by <a href="https://github.com/bramcohen/manyana/blob/main/manyana.py">470 lines of Python</a>.</p><p>I fed that Python (minus comments) into Claude and asked for ...
20時間前

「Google AI Studio」がFirebaseのバックエンドとAntigravityのコーディングエージェントを搭載、プロンプトだけで高度なフルスタックアプリケーションを生成可能に
Publickey
Googleは、Google AI Studioのバイブコーディング機能を強化し、 プロンプトで指示するだけで高度なフルスタックアプリケーションの開発が可能になったことを発表しました。 フル機能のマルチプレイヤーゲームのような高度なアプリケ...
1日前

AIエージェントがコマンドラインでブラウザを自動操作できる「Browser Use CLI 2.0」リリース。Chrome DevToolsへの接続などで操作速度が2倍に
Publickey
人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPythonライブラリ「Browser Use CLI 2.0」がリリースされました。 Browser Use CLI 2.0では、Chrom...
1日前
3/22 (日)

OpenSSLで証明書を作ってAPI Gateway(REST API)にmTLS認証を実装してみた
DevelopersIO
OpenSSLで証明書を作ってAPI Gateway(REST API)にmTLS認証を実装してみた
1日前

Amazon QuickにXX日以上ログインしていないユーザーをAmazon Quickのダッシュボードで可視化してみる
DevelopersIO
Amazon QuickにXX日以上ログインしていないユーザーをAmazon Quickのダッシュボードで可視化してみる
1日前

AgentCore CLI を使って AI エージェントを AgentCore にデプロイしてみた
DevelopersIO
AgentCore CLI を使って AI エージェントを AgentCore にデプロイしてみた
1日前

Profiling Hacker News users based on their comments Simon Willison's Weblog
<p>Here's a mildly dystopian prompt I've been experimenting with recently: "Profile this user", accompanied by a copy of their last 1,000 comments on Hacker News.</p><p>Obtaining those comments is easy. The <a href="https://hn.algolia.com/api">Algolia Hacker News API</a> supports listing comments sorted by date that have a specific tag, and the author of a comment is tagged there as <code>author_username</code>. Here's a JSON feed of my (<code>sim...
2日前

Using Git with coding agents Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Git is a key tool for working with coding agents. Keeping code in version control lets us record how that code changes over time and investigate and reverse any mistakes. All of the coding agents are fluent in using Git's features, both basic and advanced.</p><p>This fluency means we can be more ambitious abou...
2日前
3/21 (土)

業務システムでも保守運用より構築スピードが大切になっている
きしだのHatena
前回の続きというか、その背景。 3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている - きしだのHatena 業務システムが効率化のためのものから事業をまわして売上や利益を生むためのものになっているので「システム構築の柔軟性やスピードへの要求が高まった」というのがあって「3日でできるものに4ヵ月かけるというのが受け入れにくく」ということになっています。 時間をかけて確実に作り切ってあとは保守運用というのではなく、速くつくって常に改善しつづけることが大切になっているわけです。 前のエントリで運用が、保守が、というコメントが結構ついてますが、SIの価値が運用や保守であるなら、どんど…
2日前

Turbo Pascal 3.02A, deconstructed Simon Willison's Weblog
<p><strong><a href="https://tools.simonwillison.net/turbo-pascal-deconstructed">Turbo Pascal 3.02A, deconstructed</a></strong></p>In <a href="https://prog21.dadgum.com/116.html">Things That Turbo Pascal is Smaller Than</a> James Hague lists things (from 2011) that are larger in size than Borland's 1985 Turbo Pascal 3.02 executable - a 39,731 byte file that somehow included a full text editor IDE and Pascal compiler.</p><p>This inspired...
3日前

CanisterWorm: npm Publisher Compromise Deploys Backdoor Across 29+ Packages
Socket
The worm-enabled campaign hit @emilgroup and @teale.io, then used an ICP canister to deliver follow-on payloads.
3日前

Quoting Kimi.ai @Kimi_Moonshot Simon Willison's Weblog
<blockquote cite="https://twitter.com/Kimi_Moonshot/status/2035074972943831491"><p>Congrats to the <a href="https://x.com/cursor_ai">@cursor_ai</a> team on the launch of Composer 2!</p><p>We are proud to see Kimi-k2.5 provide the foundation. Seeing our model integrated effectively through Cursor's continued pretraining &amp; high-compute RL training is the open model ecosystem we love to support.</p><p>Note: Cursor accesses Kimi-k2.5 via <a...
3日前
3/20 (金)

Kimi-K2.5をさくらのAI Engineで試したら1Tパラメータの実力を感じた
きしだのHatena
Kimi K2.5が「さくらのAI Engine」でパブリックプレビューとして使えるようになっていたので試してみました。 さくらのAI Engineにてマルチモーダルモデル「Kimi-K2.5」のパブリックプレビューを開始しました | さくらのクラウドニュース Thinkingの問題があって使いにくい面はありますが、性能的にはかなり高いです。さすが1Tトークン。 コーディングはGLM-5のほうがよさそうではある。 Thinkingについてはなんらか対処してほしいところ。 今回使ったのは110リクエスト、入力160万トークン、出力14万トークンでした。 3000リクエスト/月が無料なので、余裕で…
3日前

Beyond Code Review
Radar
Not that long ago, we were resigned to the idea that humans would need to inspect every line of AI-generated code. We’d do it personally, code reviews would always be part of a serious software practice, and the ability to read and review code would become an even more important part of a developer’s skillset. […]
3日前

3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている
きしだのHatena
SIerに発注したら4ヵ月800万円という見積もりだったものをAI駆使してつくったら3日で50万円でできた、という話が話題になってました。 そこで、SIerでは作るものをちゃんと保証したりしていて文書化は大切である、みたいな指摘が入ってたりした。 でも、よく考えると、それって外注-受託において、作ると言ったものをちゃんと作ってもらったり、作ると言って作ったものにちゃんとお金を払ってもらったりするための、SI構造を維持するためのコストだったりします。 いまAIは、「800万の見積もりのものが3日でできた」ということ以上に、社会構造を変えようとしています。 そうすると、そんな変化の中で、800万円…
3日前

Trivy Under Attack Again: Widespread GitHub Actions Tag Compromise Exposes CI/CD Secrets
Socket
Attackers compromised Trivy GitHub Actions by force-updating tags to deliver malware, exposing CI/CD secrets across affected pipelines.
4日前

SQLite Tags Benchmark: Comparing 5 Tagging Strategies Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/sqlite-tags-benchmark#readme">SQLite Tags Benchmark: Comparing 5 Tagging Strategies</a></p> <p>I had Claude Code run a micro-benchmark comparing different approaches to implementing tagging in SQLite. Traditional many-to-many tables won, but FTS5 came a close second. Full table scans with LIKE queries performed better than I expected, but full table scans with JSON array...
4日前

ENISA Publishes Technical Advisory on Secure Use of Package Managers
Socket
ENISA’s new package manager advisory outlines the dependency security practices companies will need to demonstrate as the EU’s Cyber Resilience Act begins enforcing software supply chain requirements.
4日前

Thoughts on OpenAI acquiring Astral and uv/ruff/ty Simon Willison's Weblog
<p>The big news this morning: <a href="https://astral.sh/blog/openai">Astral to join OpenAI</a> (on the Astral blog) and <a href="https://openai.com/index/openai-to-acquire-astral/">OpenAI to acquire Astral</a> (the OpenAI announcement). Astral are the company behind <a href="https://simonwillison.net/tags/uv/">uv</a>, <a href="https://simonwillison.net/tags/ruff/">ruff</a>, and <a href="https://simonwillison.net/tags/ty/">ty</a>...
4日前
3/19 (木)

Keep Deterministic Work Deterministic
Radar
This is the second article in a series on agentic engineering and AI-driven development. Read part one here, and look for the next article on April 2 on O’Reilly Radar. The first 90 percent of the code accounts for the first 90 percent of the development time. The remaining 10 percent of the code accounts […]
4日前

How we monitor internal coding agents for misalignment OpenAI News
How OpenAI uses chain-of-thought monitoring to study misalignment in internal coding agents—analyzing real-world deployments to detect risks and strengthen AI safety safeguards.
4日前

金融営業から内製開発エンジニアへ ― 小さな行動で築いたキャリアの自律
NTT docomo Business Engineers' Blog
はじめに ビジネスdアプリ開発チームの徳原です。 私は地元の金融機関で12年間営業職として勤務した後、IT業界へキャリア転換しました。 本記事では、これまで私が転職で経験したことやキャリアの自律に向けた取り組みについて紹介します。 目次 はじめに これまでのキャリア 金融機関からIT業界へ 前職(外資コンサル)でのSE業務 キャリアを動かしたきっかけ 継続的な学習 前職のインフラ運用業務で苦戦したこと 前職のアプリ開発で苦戦したこと 現職へ転職することになったきっかけ 現職の業務とキャリアの広がり 学習の支援 外部発表の機会 現職のアプリ開発について これまでの経験から感じたキャリアの自律 お…
4日前

独自LLMを作るには事業会社なら10兆円企業が必要?
きしだのHatena
楽天がRakutenAI-3.0を出しましたが、DeepSeek V3アーキテクチャモデルの追加学習モデルのようで、ちょっとそこが話題になってましたね。見せ方の問題もあって、フルスクラッチではないのかと。 https://huggingface.co/Rakuten/RakutenAI-3.0 一応、非公開ではあるけどベースモデルがあることは否定してない模様。 楽天の最新AI、ベースは“中国DeepSeek製”? 担当者に聞いた(1/2 ページ) - ITmedia AI+ で、気になったので、フルスクラッチで独自LLMを作れる企業の規模はどんなものか調べてみました。 日本でフルスクラッチで作…
4日前

Google Home運用テクニック - 橋本商会 - Cosense
橋本商会 - Cosense
Google Homeを運用する上でのテクニックをまとめますshokai.iconok google 今何時 1回前のコマンドを再実行するコマンド 「では、繰り返します。明日の◯◯の天気は雨です」 2023年ぐらいからずっとバグっている 前のコマンドから長い時間が経過している場合だけ、時刻を教えてくれるok google もういいよ 昔は再生中のニュースや音楽、目覚ましを解除するコマンドだったが 2024年ごろから「こっちのけんとのもういいよを再生します」に変化した 代わりに「ok google もうやめて」を使うようになったshokai.iconok googleアラームを解除してok googleタイマーを解除して 目覚ましを解除できたり、できなかったりするコマンド
4日前

ブレインパッドOBがプロスポーツチームのデジタルマーケターへ転身!「データ×熱狂」で地域に「応援する文化」を創り出すデジマ最前線
Platinum Data Blog by BrainPad ブレインパッド
ブレインパッドが2024年8月に設立したアルムナイネットワーク「ブレインパッド アルムナイ・グラフ(以下:BAG)」。BAGは、ブレインパッドを退職した社員(以下、卒業生)と在籍中の社員の交流を生む施策を中心に、卒業生同士のつながりの醸成や、社員がキャリアを考える機会を提供することなどを目的に活動しています。● 2024年8月28日 株式会社ブレインパッド発表ブレインパッド、アルムナイネットワーク「BAG」を設立、第1回交流イベントを開催- 人材輩出企業として卒業生を応援、退職後もともにデータ活用の普及を促進 -今回より、「“BrainPad Career Junction”~ブレインパッド卒業生とともに広げる、データ/AI活用の輪~」と銘打ち、ブレインパッドの卒業生が今どのような活躍をしているのか、どのようにデータ活用の輪を社会に広げているのかをお伝えしていきます。第1弾として、2023年にブレインパッドを卒業し、現在はプロスポーツチームにてデジタルマーケティングを担当されている中島さんからお話を伺いました。熱狂を生むデジマの最前線!プロスポーツチームで挑む挑戦の日々データサイエンテ
4日前

AIを活用した大規模iOSアプリのSwift Concurrency移行戦略
Sansan Tech Blog
はじめに こんにちは!技術本部 Sansan Engineering Unit Mobile Application Groupに所属するiOSエンジニアの劉 志輝です。 今回は、ビジネスデータベース「Sansan」のiOSアプリで進めている、Swift6時代に向けたSwift Concurrencyへの移行戦略についてお話しします。 このアプリは10年以上にわたって継続開発されており、UIKit + VIPERアーキテクチャで構成されています。 非同期処理にはRxSwift(Single、Observable、BehaviorRelay)とGCD(DispatchSemaphore、Disp…
5日前

OpenAI to acquire Astral OpenAI News
Accelerates Codex growth to power the next generation of Python developer tools
5日前

カケハシ入社半年で感じたこと
KAKEHASHI Tech Blog
はじめに はじめまして、竹浪と申します。2025年8月にカケハシへエンジニアとして入社しました。 現在は Pocket Musubi チームに所属しています。この記事では、入社の経緯や、半年間で感じたことをお伝えできればと思います。 自己紹介・これまでの経歴 1999年に専門学校を卒業後、SI系の会社でエンジニアとしてのキャリアをスタートしました。翌年にはフリーランスに転向し、その後メガベンチャーを含むWeb企業を経て、複数のスタートアップでの開発にも携わってきました。 技術スタックとしては Go、Java、PHP を中心としたバックエンド開発が主軸で、AWS や GCP を活用したインフラの…
5日前

Autoresearching Apple's "LLM in a Flash" to run Qwen 397B locally
Simon Willison's Weblog
<p><strong><a href="https://twitter.com/danveloper/status/2034353876753592372">Autoresearching Apple&#x27;s &quot;LLM in a Flash&quot; to run Qwen 397B locally</a></strong></p>Here's a fascinating piece of research by Dan Woods, who managed to get a custom version of <a href="https://huggingface.co/Qwen/Qwen3.5-397B-A17B/tree/main">Qwen3.5-397B-A17B</a> running at 5.5+ tokens/second on a 48GB MacBook Pro M3 Max despite that model takin...
5日前

AI Agentの本番運用を通して学んだ3つのガードレール
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の135週目の記事です!3年間連続達成まで残り24週となりました! はじめに:AI Agentは「動かす」より「安定させる」が難しいこんにちは、ログラスでエンジニアしている山崎です。私は2025年11月に入社して以来、AI Agentの新規事業の開発をしています。私たちはLangGraphでAI Agentを構築し、経営の実績データに対する分析コメント(以下、財務分析コメント)をLLMに生成させる機能を開発・運用しています。なお、本機能で利用するLLM APIは、入力データがモデル...
5日前

datasette 1.0a26 Simon Willison's Weblog
<p><strong>Release:</strong> <a href="https://github.com/simonw/datasette/releases/tag/1.0a26">datasette 1.0a26</a></p> <p>Datasette now has a mechanism for assigning semantic column types. Built-in column types include <code>url</code>, <code>email</code>, and <code>json</code>, and plugins can register additional types using the new <a href="https://docs.datasette.io/en/latest/plugin_hooks.html#plugin-register-co...
5日前

GlassWorm Sleeper Extensions Activate on Open VSX, Shift to GitHub-Hosted VSIX Malware
Socket
We identified over 20 additional malicious extensions, along with over 20 related sleeper extensions, some of which have already been weaponized.
5日前

Snowflake Cortex AI Escapes Sandbox and Executes Malware Simon Willison's Weblog
<p><strong><a href="https://www.promptarmor.com/resources/snowflake-ai-escapes-sandbox-and-executes-malware">Snowflake Cortex AI Escapes Sandbox and Executes Malware</a></strong></p>PromptArmor report on a prompt injection attack chain in Snowflake's <a href="https://docs.snowflake.com/en/user-guide/snowflake-cortex/cortex-agents">Cortex Agent</a>, now fixed.</p><p>The attack started when a Cortex user asked the agent to review a GitHu...
5日前

Node.js互換でコンテナよりも高密度と高速起動を実現する「Edge.js」、Wasmerが発表
Publickey
WebAssemblyランタイム「Wasmer」を開発提供するWasmer社は、Node.js互換かつコンテナよりも高密度な集約と高速起動を実現する「[Edge.js](https://edgejs.org/)」を発表しました。 What ...
5日前
3/18 (水)

What Is the PARK Stack?
Radar
Background: Stacks with four-letter acronyms According to Wikipedia, the LAMP stack was coined in 1998 by Michael Kunze to describe what had emerged as a popular open source software stack for websites. When the World Wide Web exploded in popularity earlier in the ’90s, organizations used an ad hoc mixture of proprietary tools and operating […]
5日前

LINEヤフーのエンジニアの動向を知る:State of LY 2025実施レポート LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフーでは、2024年に引き続き、2025年も社内の開発者を対象としたアンケート「State of LY 2025」を実施しました(昨年度の実施レポート)。昨年はWebフロントエンド開発者のみ...
5日前

LINE iOSアプリにWebKitの新API「WebPage」を導入できず、自前で実装した件 LINEヤフー Tech Blog (LY Corporation Tech Blog
はじめにこんにちは、iOSアプリエンジニアのKiichiです。LINE iOSアプリでアプリ内ブラウザなど、Webまわりの開発を担当しています。普段はUIKitをベースに機能改善や新機能開発を進めつつ...
6日前

cdk8s の Helm 実行結果をキャッシュしてマニフェスト生成を高速化した
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone 生成 AI チームで連載中の kintone AI リレーブログ 2026 の 10 本目の記事です。リレーブログでは生成 AI チームのメンバーが AI トピックに限らず、さまざまなことについて発信していきます。こんにちは! kintone の生成 AI チームでソフトウェアエンジニアをやっている福田です。私たちのチームでは cdk8s を使って Kubernetes マニフェストを管理しています。(cdk8s の詳細は別の記事で紹介していますので、あわせてご覧ください。)cdk8s を使うと TypeScript でマニフェストが書けるだけでなく、Helm チャートと統合したマニフェスト管理も簡単に行うことができて非常に便利なのですが、YAML のマニフェスト生成に時間がかかることがチーム内でも問題になっていました。Kubernetes へのデプロイは、cdk8s で生成した YAML のマニフェストを apply するという方法で行っており、その生成に時間がかかってしまうと、開発のイテレーションが遅くなってしまいます。今回はマニフェスト生成が遅いという
6日前

2026年4月の技術系イベント予定
LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...
6日前

Nemotron 3 Nano 4Bを試す。Qwen3.5やQwen3のほうがいいかも
きしだのHatena
Nemotron 3 Nano 4Bというのが出ていたので、Q8_0で試してみます。 Nemotron 3 Nano 4B: A Compact Hybrid Model for Efficient Local AI 結論でいうと、Qwen3-4BやQwen3.5-4Bよりいい点はあまり見当たりませんでした。 知識カットオフは? 2024-6っぽいけど、なかなか・・・ 「きしだ」というのはあってそうだけど、 Qwen3.5-4Bは、石破さんは102代だけどだいたいあってて、知識も新しい。 Qwen3-4Bは読み方以外は正しい。知識はちょい古い。 日本知識 どこのことを言ってる? Qwen3.5…
6日前

Sansanのデータ化オペレーションを支えるデータ基盤hydra
Sansan Tech Blog
技術本部Digitization部Platform Engineeringグループの湯村です。Sansanでは、名刺や請求書などの情報を正確なデータへ変換するために、AIによる自動処理と人による補正を組み合わせた大規模な運用体制を構築しています。この記事では、こうしたデータ化の運用を拡大する中で直面した課題と、それを解決するために構築したデータ基盤hydraの設計について紹介します。
6日前

「自分でやり切る」だけでチームは強くならない
NTT docomo Business Engineers' Blog
NTTドコモビジネス イノベーションセンター テクノロジー部門 MetemcyberPJでの経験を通じ、私は「自分でやり切ること」と「チームとして成果を出すこと」のバランスの重要性を学びました。若手社員でも幅広い業務に挑戦できる環境の中で、責任感を持ちながらも周囲と協力することで、個人の成長とチーム成果の両立が可能であると実感しています。この記事では、その経験から得た学びと実践のポイントを紹介します。 はじめに 若手でも幅広く挑戦できる環境 スクラムという前提 私が経験した「抱え込み」 タスクの優先順位のつけ方 最後に はじめに こんにちは。イノベーションセンター テクノロジー部門 Metem…
6日前

40,000行のAPIテスト作成で学んだClaude Code Skillsの育て方
カミナシ エンジニアブログ
こんにちは、ソフトウェアエンジニアの渡邉(匠)です。「カミナシ 設備保全」の開発に携わっています。 Claude CodeのSkills(以下スキル)を使い、約2週間で40,000行超のAPIシナリオテストを書き切りました。最初のスキルは粗削りでしたが、テストを量産する中で繰り返し改善した結果、後半は「スキル実行 → レビュー → マージ」のサイクルだけで回せるようになりました。 この記事では、スキルをどう設計し、どう育てたかを中心にお伝えします。 背景 APIの動作保証にシナリオテストツール runn を使っていました。 サービス成長に伴うAPIの増加により、当初のテスト構成では運用が回らな…
6日前

Quoting Ken Jin Simon Willison's Weblog
<blockquote cite="https://fidget-spinner.github.io/posts/jit-on-track.html"><p>Great news—we’ve hit our (very modest) performance goals for the CPython JIT over a year early for macOS AArch64, and a few months early for x86_64 Linux. The 3.15 alpha JIT is about <strong>11-12%</strong> faster on macOS AArch64 than the tail calling interpreter, and <strong>5-6%</strong>faster than the standard interpreter on x86_64 Linux.</p></blockquote><p class...
6日前

GPT-5.4 mini and GPT-5.4 nano, which can describe 76,000 photos for $52 Simon Willison's Weblog
<p>OpenAI today: <a href="https://openai.com/index/introducing-gpt-5-4-mini-and-nano/">Introducing GPT‑5.4 mini and nano</a>. These models join GPT-5.4 which was released <a href="https://openai.com/index/introducing-gpt-5-4/">two weeks ago</a>.</p><p>OpenAI's self-reported benchmarks show the new 5.4-nano out-performing their previous GPT-5 mini model when run at maximum reasoning effort. The new mini is also 2x faster than the previous mini.</p>...
6日前

llm 0.29 Simon Willison's Weblog
<p><strong>Release:</strong> <a href="https://github.com/simonw/llm/releases/tag/0.29">llm 0.29</a></p> <p>Adds support for OpenAI's new models <code>gpt-5.4</code>, <code>gpt-5.4-mini</code>, and <code>gpt-5.4-nano</code>.</p>
6日前

Improving breast cancer screening workflows with machine learning
The latest research from Google
Health & Bioscience
6日前

Quoting Tim Schilling Simon Willison's Weblog
<blockquote cite="https://www.better-simple.com/django/2026/03/16/give-django-your-time-and-money/"><p>If you do not understand the ticket, if you do not understand the solution, or if you do not understand the feedback on your PR, then your use of LLM is hurting Django as a whole. [...]</p><p>For a reviewer, it’s demoralizing to communicate with a facade of a human.</p><p>This is because contributing to open source, especially Django, is a communal endeavor....
6日前

JavaにJavaScriptエンジン「V8」とPythonランタイム「CPython」を組み込む「Project Detroit」、オラクルが発表
Publickey
オラクルは、カリフォルニア州レッドウッドシティで開幕したイベント「JavaOne 2026」で、「Project Detroit」(以下、Detroit)をOpenJDKのプロジェクトプロポーザル(プロジェクト提案)として発表しました。 D...
6日前

福岡Rubyist会議05に行ってきました!
Timee Product Team Blog
福岡Rubyist会議05 参加レポート こんにちは!Timeeでバックエンドエンジニアをしている志賀(@akitoshiga)です。 表題の通り「福岡Rubyist会議05 」に参加してきたのでそちらのレポートを書きたいと思います! regional.rubykaigi.org 今回「Kaigi Pass」という社内制度を利用して参加しました。 「Kaigi Pass」とは、世界中で開催されているすべての技術カンファレンスに無制限で参加できる制度です。 productpr.timee.co.jp 会場の様子 当日は福岡県福岡市博多区にある「リファレンス駅東ビル」というところで行われました。 …
6日前

「Java 26」正式リリース。HotSpotの起動高速化、HTTP/3クライアント対応など新機能
Publickey
オラクルはJavaの最新バージョン「Java 26」正式版のリリースを発表しました。日本時間で今日(2026年3月18日)未明にカリフォルニア州レッドウッドシティで開幕したJavaOne 2026でも、Java 26のリリースが紹介されまし...
6日前
3/17 (火)

Subagents Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>LLMs are restricted by their <strong>context limit</strong> - how many tokens they can fit in their working memory at any given time. These values have not increased much over the past two years even as the LLMs themselves have seen dramatic improvements in their abilities - they generally top out at around 1,...
6日前

Stop Closing the Door. Fix the House.
Radar
The following article originally appeared on Angie Jones’s website and is being republished here with the author’s permission. I’ve been seeing more and more open source maintainers throwing up their hands over AI-generated pull requests. Going so far as to stop accepting PRs from external contributors. If you’re an open source maintainer, you’ve felt this […]
6日前

Introducing GPT-5.4 mini and nano OpenAI News
GPT-5.4 mini and nano are smaller, faster versions of GPT-5.4 optimized for coding, tool use, multimodal reasoning, and high-volume API and sub-agent workloads.
6日前

OpenAI Japan announces Japan Teen Safety Blueprint to put teen safety first OpenAI News
OpenAI Japan announces the Japan Teen Safety Blueprint, introducing stronger age protections, parental controls, and well-being safeguards for teens using generative AI.
6日前

ai.rakuten.co.jpで動いてるのはSonnet?->GPT系っぽい
きしだのHatena
楽天からRakutenAI-3.0がApache 2.0ライセンスで公開されていました。DeepSeek V3アーキテクチャの671B-A37Bのモデルです。 https://huggingface.co/Rakuten/RakutenAI-3.0 ということで、とりあえずai.rakutenで試してみようと思ったのですね。自社のフラグシップモデルを使ってるだろうと思って。 https://ai.rakuten.co.jp/chat で、ブロック崩しを作ってもらったら、こういうきれいなブロック崩しを作ってきました。 パーティクルだけ後付け。 「おぉすごい」と思ったのだけど、いろいろ試すと、ちょ…
6日前

Vol.12 GKEにIAPを適用してコア機能に集中しよう
Sansan Tech Blog
技術本部Data Intelligence Engineering Unitのスタッフソフトウェアエンジニア藤原です。 Sansan Data Intelligence開発Unitブログリレーのvol.12として、少し趣向を変えて、今日はGoogle Cloudのちょっとだけマニアックだけど便利な機能、IAP(Identity-Aware Proxy)の活用について紹介します。
6日前

ベクトル検索エンジンValdの長期運用で見えたパフォーマンス最適化とベストプラクティス LINEヤフー Tech Blog (LY Corporation Tech Blog
はじめに私たちは、社内のプラットフォームにおいて、Cloud NativeなANN(近似最近傍探索)ベクトル検索エンジン「Vald」のマネージドシステムを約4年間にわたり運用・開発してきました。本記事...
7日前

Equipping workers with insights about compensation OpenAI News
New research shows Americans send nearly 3 million daily messages to ChatGPT asking about compensation and earnings, helping close the wage information gap.
7日前

Async React の設計思想と Signal の違いを Transition を中心に考える
KAKEHASHI Tech Blog
ランキング参加中プログラミング こんにちは。フロントエンドエンジニアをしているNokogiri(@nkgrnkgr)です。 はじめに 私たちのReactをつかったプロダクトでは Suspense をデータフェッチに利用しています。useTransition や useOptimistic も触ったことはありましたが、プロダクションでどう活かすかという解像度がまだ上がっていませんでした。 そんなとき、uhyo さんの「React 19時代のコンポーネント設計ベストプラクティス」や「Async Reactとは何か」を読んで、Async React の全体像をちゃんと理解したくなりました。実際にコー…
7日前

Introducing Mistral Small 4 Simon Willison's Weblog
<p><strong><a href="https://mistral.ai/news/mistral-small-4">Introducing Mistral Small 4</a></strong></p>Big new release from Mistral today (despite the name) - a new Apache 2 licensed 119B parameter (Mixture-of-Experts, 6B active) model which they describe like this:</p><blockquote><p>Mistral Small 4 is the first Mistral model to unify the capabilities of our flagship models, Magistral for reasoning, Pixtral for multimodal, and Devstral for...
7日前

Use subagents and custom agents in Codex Simon Willison's Weblog
<p><strong><a href="https://developers.openai.com/codex/subagents">Use subagents and custom agents in Codex</a></strong></p>Subagents were announced in general availability today for OpenAI Codex, after several weeks of preview behind a feature flag.</p><p>They're very similar to the Claude Code implementation, with default subagents for "explorer", "worker" and "default". It's unclear to me what the difference between "worker" and "default" is bu...
7日前

Quoting A member of Anthropic’s alignment-science team Simon Willison's Weblog
<blockquote cite="https://www.newyorker.com/news/annals-of-inquiry/the-pentagon-went-to-war-with-anthropic-whats-really-at-stake?_sp=9a6e0ff7-2bfd-46f8-a9e1-3941ef2003b5.1773495048769"><p>The point of <a href="https://simonwillison.net/2025/Jun/20/agentic-misalignment/">the blackmail exercise</a> was to have something to describe to policymakers—results that are visceral enough to land with people, and make misalignment risk actually salient in practice for people who ha...
7日前

Quoting Guilherme Rambo Simon Willison's Weblog
<blockquote cite="https://daringfireball.net/2026/03/apple_enclaves_neo_camera_indicator"><p>Tidbit: the software-based camera indicator light in the MacBook Neo runs in the secure exclave¹ part of the chip, so it is almost as secure as the hardware indicator light. What that means in practice is that even a kernel-level exploit would not be able to turn on the camera without the light appearing on screen. It runs in a privileged environment separate from the kernel and blits the li...
7日前

Coding agents for data analysis Simon Willison's Weblog
<p><strong><a href="https://simonw.github.io/nicar-2026-coding-agents/">Coding agents for data analysis</a></strong></p>Here's the handout I prepared for my NICAR 2026 workshop "Coding agents for data analysis" - a three hour session aimed at data journalists demonstrating ways that tools like Claude Code and OpenAI Codex can be used to explore, analyze and clean data.</p><p>Here's the table of contents:</p><blockquote><ul><li...
7日前

Testing LLMs on superconductivity research questions
The latest research from Google
Education Innovation
7日前

データセンターが武力紛争時の攻撃目標になる時代。中東の武力紛争で両陣営ともにデータセンターを狙った攻撃を実行
Publickey
日本時間3月1日に行われた米国とイスラエルによるイランへの攻撃開始から約2週間が経過した中東における武力紛争は、データセンターが明確な攻撃目標としてクローズアップされた歴史上初めての武力紛争になりました。 この紛争における両陣営のデータセン...
7日前



