直近1週間の更新
3/21 (土)

White House Unveils National AI Policy to Sweep Aside State Regulations
PYMNTS.com
The White House unveiled a National Policy Framework for Artificial Intelligence Friday (March 20), saying that this set of legislative recommendations is designed to help American industry innovate and American people benefit from the technology. The framework aims to provide a consistent national policy, the White House said in a Friday press release. “Importantly, […]The post White House Unveils National AI Policy to Sweep Aside State Regulations appeared first on PYMNTS.com.
5分前
3/20 (金)

Kimi-K2.5をさくらのAI Engineで試したら1Tパラメータの実力を感じた
1
きしだのHatena
Kimi K2.5が「さくらのAI Engine」でパブリックプレビューとして使えるようになっていたので試してみました。 さくらのAI Engineにてマルチモーダルモデル「Kimi-K2.5」のパブリックプレビューを開始しました | さくらのクラウドニュース Thinkingの問題があって使いにくい面はありますが、性能的にはかなり高いです。さすが1Tトークン。 コーディングはGLM-5のほうがよさそうではある。 Thinkingについてはなんらか対処してほしいところ。 今回使ったのは110リクエスト、入力160万トークン、出力14万トークンでした。 3000リクエスト/月が無料なので、余裕で…
1時間前

Amazon Drafts AI Smartphone Strategy to Support Digital Services
PYMNTS.com
Amazon is developing a smartphone that will integrate artificial intelligence capabilities and sync with the company’s voice assistant Alexa, Reuters reported Friday (March 20), citing unnamed sources. Known internally as “Transformer,” the phone will offer personalized features that will enhance the Amazon shopping experience and services such as Prime Video and Amazon Music, according […]The post Amazon Drafts AI Smartphone Strategy to Support Digital Services appeared first on PYMNTS.com.
1時間前

【登壇レポート】JAWS-UG朝会で「個人的によく知らなかった AgentCore Memoryの機能を中心に深掘りしてみた」というタイトルで登壇しました
DevelopersIO
【登壇レポート】JAWS-UG朝会で「個人的によく知らなかった AgentCore Memoryの機能を中心に深掘りしてみた」というタイトルで登壇しました
2時間前

Beyond Code Review
Radar
Not that long ago, we were resigned to the idea that humans would need to inspect every line of AI-generated code. We’d do it personally, code reviews would always be part of a serious software practice, and the ability to read and review code would become an even more important part of a developer’s skillset. […]
4時間前

OpenAI Reworks Product Strategy Around New Desktop Super App
PYMNTS.com
OpenAI is preparing a new push to make ChatGPT more central to how people work on their computers. It plans to combine its ChatGPT app, Codex coding platform and browser into a desktop “super app.” According to The Wall Street Journal, the move is meant to simplify the user experience while helping the company sharpen […]The post OpenAI Reworks Product Strategy Around New Desktop Super App appeared first on PYMNTS.com.
5時間前

LLM の検閲を解除する方法
Zennの「大規模言語モデル」のフィード
はじめに最近、HuggingFace などのトレンド欄で uncensored あるいは decensored などと銘打った、検閲解除済みモデルを見かける機会が増えています。これらのモデルでは、元のモデルが持つ性能を維持しつつ安全性のための命令拒否メカニズムが外されており、基本的にどのような入力にも応答するように調整されています。一見すると、このようなモデルをつくるためには有害なデータを用いた大規模な再学習が必要に思えますが、現在主流となっているのは再学習を伴わない Abliteration と呼ばれる手法です。https://arxiv.org/abs/2406.11717...
6時間前

企業向けAIチャットボットの設計と実装
Zennの「大規模言語モデル」のフィード
企業向けAIチャットボットの設計と実装企業向けAIチャットボットは、単なるFAQ自動化ツールではありません。実際には、ナレッジ検索・業務支援・問い合わせ削減・オペレーション効率化 を担う業務システムとして設計する必要があります。一方で、PoCではうまく見えても、本番導入後に以下の課題で止まるケースが多くあります。回答精度が安定しない社内データを安全に扱えない誤回答時の運用がないチャットUIだけ作って終わる改善ループが回らない本記事では、企業向けAIチャットボットを 本番運用まで見据えて設計・実装する方法 を、アーキテクチャ・実装ポイント・運用設計の観点から整理...
6時間前

Trulioo Says Always-On Identity Checks Needed to Stop Fraud
PYMNTS.com
Know your customer (KYC) and know your business (KYB) remain the first formal barrier between legitimate commerce and organized fraud, yet their durability depends on how they are operationalized across the enterprise. Zac Cohen, chief product officer at Trulioo, said too many organizations still rely on episodic controls. “It’s still treating it as a […]The post Trulioo Says Always-On Identity Checks Needed to Stop Fraud appeared first on PYMNTS.com.
7時間前

Tokenization Powers Invisible Checkout in Agentic Commerce
PYMNTS.com
Tokenization is evolving into a structural layer that allows commerce to proceed without a visible checkout. The shift anchored “The Prompt Economy™ Tracker® Series: Tokens, Trust and Transactions,” a PYMNTS Intelligence and Visa collaboration that examined how payment tokenization enables agents and wallets to transact without exposing underlying card numbers. The report framed tokenization […]The post Tokenization Powers Invisible Checkout in Agentic Commerce appeared first on PYMNTS.com.
7時間前

56% of Gen Z Struggle to Track When Installment Payments Are Due
PYMNTS.com
For many consumers, pay later is shifting from a checkout convenience to a budgeting tool. The biggest drivers of the shift are millennials and their slightly older counterparts, who are using installment plans and buy now, pay later (BNPL) services more often than other generations. That trend appeared in “The Pay Later Ecosystem Report: […]The post 56% of Gen Z Struggle to Track When Installment Payments Are Due appeared first on PYMNTS.com.
7時間前

How 30 Million Workers Borrow From Tomorrow to Pay for Today
PYMNTS.com
Every payday, millions of American workers face some version of the same problem: The bill is due today, the paycheck arrives Friday and they must somehow cover the distance between those two moments. For Labor Economy workers—the warehouse associates, delivery drivers, caregivers, cooks and retail staff who collectively drive more than $1.7 trillion in […]The post How 30 Million Workers Borrow From Tomorrow to Pay for Today appeared first on PYMNTS.com.
7時間前

Fraud Gets Cheaper, Merchants Push Back
PYMNTS.com
Watch more: What’s Next in Payments With Spreedly’s Adam Hiatt The fraud economy has always been adaptive. For every 12-foot wall that a firm stands up, fraudsters have tried to find a corresponding 13-foot ladder. But the rise of generative artificial intelligence (AI) and synthetic media has pushed the contest between merchants and attackers […]The post Fraud Gets Cheaper, Merchants Push Back appeared first on PYMNTS.com.
7時間前

Americans Make New Technology a Daily Habit at Record Speed
PYMNTS.com
Cue the “2001: A Space Odyssey” theme: Human lives have always been shaped by new technology. You can track it (pardon the pun) from railroads to the internet to smartphones. Now, artificial intelligence is the latest tool transforming the way we live. AI adoption just crossed an important line. Between December and January, the […]The post Americans Make New Technology a Daily Habit at Record Speed appeared first on PYMNTS.com.
7時間前

GPT-5.4リリース — コーディングと推論の統合で何が変わったか
Zennの「大規模言語モデル」のフィード
はじめに2026年3月5日、OpenAIがGPT-5.4をリリースした。これまでコーディング特化のGPT-5.3-Codexと汎用推論のGPT-5.2を使い分ける必要があったが、GPT-5.4はその両方を1つのモデルに統合している。「コーディングはCodex、推論は5.2」という切り替えが不要になったわけだ。さらに3月17日にはGPT-5.4 miniとnanoもリリースされ、用途に応じたモデル選択の幅も広がった。この記事では、GPT-5.4で実際に何が変わったのかをベンチマークと実用面から整理する。 GPT-5.4の主な変更点 コーディングと推論の統合GPT-5.4最...
8時間前

[アップデート] AWS Lambda関数の実行環境がどのAZで動作しているかを取得できるメタデータエンドポイントが追加されました
DevelopersIO
AWS Lambda関数内から、今回追加されたメタデータエンドポイントにHTTPリクエストを送れば、AZ IDを取得できます。
8時間前

3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている
12
きしだのHatena
SIerに発注したら4ヵ月800万円という見積もりだったものをAI駆使してつくったら3日で50万円でできた、という話が話題になってました。 そこで、SIerでは作るものをちゃんと保証したりしていて文書化は大切である、みたいな指摘が入ってたりした。 でも、よく考えると、それって外注-受託において、作ると言ったものをちゃんと作ってもらったり、作ると言って作ったものにちゃんとお金を払ってもらったりするための、SI構造を維持するためのコストだったりします。 いまAIは、「800万の見積もりのものが3日でできた」ということ以上に、社会構造を変えようとしています。 そうすると、そんな変化の中で、800万円…
9時間前

Microsoft が提案する Mnemis メモリシステムを自作 AI アプリに実装してみた
Zennの「大規模言語モデル」のフィード
はじめにLLMベースのエージェントにとって、過去の対話情報をどのように蓄積し、どう引き出すか は根幹的な課題です。コンテキストウィンドウには上限があり、すべての会話履歴をそのまま渡し続けることは現実的ではありません。この問題に対してMicrosoftが提案したのが Mnemis です。Mnemisの核心は以下の2点に集約されます。https://arxiv.org/abs/2602.15313対話をチャンク化し、エンティティと関係性を抽出して知識グラフに格納する(事前準備フェーズ)System-1(ハイブリッド検索)とSystem-2(LLM 駆動の階層探索)を並行...
12時間前

Trivy Under Attack Again: Widespread GitHub Actions Tag Compromise Exposes CI/CD Secrets
Socket
Attackers compromised Trivy GitHub Actions by force-updating tags to deliver malware, exposing CI/CD secrets across affected pipelines.
12時間前

なぜ Efficient Prompt は有効なのか:生成AIの多層制御における入力設計
Zennの「大規模言語モデル」のフィード
!TL;DR前稿では、商用生成AIを単なる次トークン予測器ではなく、ベースモデル、alignment、policy、router、monitor などを含む多層システムとして捉えるべきだと述べた。その視点に立つと、表面の prompt だけで生成AI全体を思い通りに制御しようとする発想には限界がある。それにもかかわらず、実務では入力設計の違いによって安定性が大きく変わる。その理由は、prompt がモデル内部を直接支配するからではない。むしろ、外側から意味の通路を狭め、拘束条件を与える からである。本稿では、私が以前「Efficient Prompt」と呼んだ考え方を、単なる p...
12時間前

LLM同士のコードレビューを観察する
Zennの「大規模言語モデル」のフィード
はじめにLLMにある程度のコードレビューを任せる方も少なくないと思います。各モデルはそれぞれ独自のコーパスで学習しており、自分が生成したコードのパターンは自分の学習データに近く、他モデルの出力は学習データに含まれていない可能性が高いと考えました。この差がセルフレビューと他モデルのレビューに差が生じるのではないかと思い、測ってみました。!個人の実験のため、参考程度にお願いします。 実験 タスク4段階の難易度でコードを生成・レビューします。Level課題期待コード量評価軸1レートリミッタ~30行3軸(30点満点)2LRUキャッシ...
13時間前

Amazon Buys Robot Maker RIVR to Win Last-Mile Delivery Race
PYMNTS.com
Amazon has acquired RIVR, a company that uses physical artificial intelligence and wheeled-legged robots to automate doorstep delivery. RIVR CEO and Co-Founder Marko Bjelonic announced the acquisition in a Thursday (March 19) post on LinkedIn, and several media reports said an Amazon spokesperson confirmed the deal. “This step will accelerate our vision of building […]The post Amazon Buys Robot Maker RIVR to Win Last-Mile Delivery Race appeared first on PYMNTS.com.
13時間前

AIにレガシーコードを変更させる前にやること
Zennの「大規模言語モデル」のフィード
AIに「この処理を修正して」と頼んだ。変更後のコードは動いた。しかし翌日、別の場所で謎のエラーが出た。調べると、AIが変更した処理が既存の認証フローを静かに迂回していた。テストは通っていた。壊れているのに通っていた。誰もAIを責められない。「既存の構造に従って変更して」とは言っていなかった。 なぜAIは既存構造を無視するのか「既存のスタイルを真似て変更して」という指示は意外と機能しない。変数名やインデントは真似る。しかし処理の構造——認証をどこで通しているか、エラーをどう返しているか、DBアクセスをどのレイヤーに閉じているか——は真似ない。真似なかったのではなく、「何を真似るべ...
13時間前

人手レビューだけに頼れない現場のためのハルシネーション検知 — SelfCheckGPTにならって“自己チェックLLM”を組み込む
Zennの「大規模言語モデル」のフィード
はじめにルミナイR&Dチームの栗原です。「この回答、本当に合ってるのか…?」LLM を本番運用していると、最後は人間が全部読むしかない状態になりがちです。FAQ ボットが、自信満々に事実と違う回答を返す社内ナレッジを RAG で検索しているはずなのに、ソースにないことを言い切るレポート生成の草稿としては便利だけど、全部目でチェックすると疲れるこうした「ハルシネーション(もっともらしいけど事実じゃない話)」問題に対して、Potsawee Manakul らの SelfCheckGPT は、外部データベースも、モデル内部の確率分布も使わずにLLM 自身...
14時間前

【非エンジニアのためのClaude/ClaudeCodeシリーズ 】 非エンジニアがClaude Codeで定常業務を自動化しようとして気づいたこと
1
DevelopersIO
【非エンジニアのためのClaude/ClaudeCodeシリーズ 】 非エンジニアがClaude Codeで定常業務を自動化しようとして気づいたこと
16時間前

RAGの検索精度を爆上げする「インデックス最適化」3選:MultiVector, RAPTOR, ColBERTを徹底比較
Zennの「大規模言語モデル」のフィード
はじめにRAG(Retrieval-Augmented Generation:検索拡張生成)を実装してみたものの、「思ったより検索精度が出ない...」と悩んでいませんか?実は、単に文書を細切れにしてベクトル化する「Naive RAG」だけでは限界があります。本記事では、インデックス化の工夫で検索精度を劇的に向上させる3つの手法をわかりやすくまとめました。 この記事で分かることMultiVectorRetriever、RAPTOR、ColBERTの仕組みと違いそれぞれの手法がどんな場面で使えるか実装時のコストや難易度の比較実際に選ぶべき手法の判断基準 前提知識:...
16時間前

[アップデート] Amazon CloudWatch のテレメトリ設定の有効化ルールを使って組織の EC2 インスタンスで CloudWatch 詳細モニタリングを自動で有効化できるようになりました
DevelopersIO
[アップデート] Amazon CloudWatch のテレメトリ設定の有効化ルールを使って組織の EC2 インスタンスで CloudWatch 詳細モニタリングを自動で有効化できるようになりました
17時間前

ローカルLLMでCopilot代替を立てたら143tok/sで補完できた — 3モデル実測比較
Zennの「大規模言語モデル」のフィード
はじめにGitHub Copilotは月額$10。年間$120。チームで使えばもっとかかる。一方、ローカルGPUがあれば月額0円でコード補完サーバーが立てられる。この記事では、RTX 4080 (16GB) + Ollama + FastAPIで、OpenAI互換のコード補完APIを構築し、3モデルで実測ベンチマークした全記録を公開する。 結論を先にモデルサイズ速度品質向きdeepseek-coder-v2:16b8.9GB143 tok/s83%速度重視、FIM対応qwen3.5:4b3.4GB72 tok/s75%軽量、FI...
17時間前

AI実装の分業をローカルで試したら、差を決めていたのは引き継ぎと実装計画だった
Zennの「大規模言語モデル」のフィード
生成AIにコードを書かせる方法として、1つのモデルに設計から実装まで任せるやり方と、設計と実装を別のモデルに分けるやり方がある。この数日、ローカルで Qwen3.5 + Ollama + Claude Code を使って、その2つを何パターンか試してみた。目についたのは、モデルの賢さそのものより、もっと地味なところだった。これは純粋なモデルのベンチマークではなく、分業実装がどこで失敗するかを見るための探索だ。勝敗を決めていたのは、推論の強さそのものより次の2点だった。実装役が所定の形式で成果物を出せるか実装役が読み違えにくい計画になっているかこの記事では、todo-lit...
17時間前

ENISA Publishes Technical Advisory on Secure Use of Package Managers
Socket
ENISA’s new package manager advisory outlines the dependency security practices companies will need to demonstrate as the EU’s Cyber Resilience Act begins enforcing software supply chain requirements.
1日前

Thoughts on OpenAI acquiring Astral and uv/ruff/ty Simon Willison's Weblog
<p>The big news this morning: <a href="https://astral.sh/blog/openai">Astral to join OpenAI</a> (on the Astral blog) and <a href="https://openai.com/index/openai-to-acquire-astral/">OpenAI to acquire Astral</a> (the OpenAI announcement). Astral are the company behind <a href="https://simonwillison.net/tags/uv/">uv</a>, <a href="https://simonwillison.net/tags/ruff/">ruff</a>, and <a href="https://simonwillison.net/tags/ty/">ty</a>...
1日前

【LLM基礎】生成AIの「トークン」って何? —— 文字数との違いと「日本語コスパ問題」
Zennの「大規模言語モデル」のフィード
当初、AIのトークン=言葉、だと理解していました。「猫」も「なつやすみ」も「English」もすべて1トークンという理解。ところがどうもそういうわけではないらしい、という疑問を紐解いてみました。AI(LLM)を利用していると、「4000トークン(約3000文字)」といった表記を見かけます。「あれ?文字数よりトークンのほうが多いのはなぜ?」と疑問に思ったため調べてみました。 1. トークンはAI専用の「パズルのピース」人間は言葉を「文字」や「単語」として認識しますが、AIはそのままでは理解できません。そこで、言葉を独自の最小単位である**「トークン(Token)」**に...
1日前
3/19 (木)

Claude Code の /batch コマンドで同じ作業を6並列で回してみた
DevelopersIO
Claude Code /batch コマンドの使い方を実例で解説。Vitest テスト生成の並列実行、rules/skills でのルール適用、実案件で学んだ注意点をまとめました。
1日前

Keep Deterministic Work Deterministic
Radar
This is the second article in a series on agentic engineering and AI-driven development. Read part one here, and look for the next article on April 2 on O’Reilly Radar. The first 90 percent of the code accounts for the first 90 percent of the development time. The remaining 10 percent of the code accounts […]
1日前

スクレイピング×OpenAIでデータから記事を自動生成する方法【2026年版】
Zennの「大規模言語モデル」のフィード
スクレイピング×OpenAI 記事自動生成とは何かスクレイピング×OpenAI記事自動生成パイプラインとは、Webから収集した生データ(価格・ニュース・統計・競合情報等)をOpenAIのAPIに渡し、Structured Outputsで構造化した上でMarkdown/HTML記事を自動生成する仕組みのことだ。 HTMLをそのままプロンプトに渡すのではなく、「①スクレイピングで収集→②HTMLクリーニングでテキスト化→③PydanticスキーマでGPTに構造化抽出させる→④記事生成プロンプトに渡す→⑤出力を検証・保存」という5段階パイプラインが品質と安定性の鍵になる。2026年現在...
1日前

AIエージェントと画像生成で遊んだ一日【3月の技術日記】
Zennの「大規模言語モデル」のフィード
!シュウゴさんの体験をクロちゃんが記事にしました。 朝イチでエージェントがバグってた今朝、Discordを開いたら自作のAIエージェントが延々と同じメッセージを送り続けていた。原因は簡単。heartbeat処理でHEARTBEAT_OKを返すべきところを、毎回カレンダーチェックを走らせてた。しかもチェック結果を毎回報告する設定になってて、30分おきに「今日の予定はありません」って通知が来る。うるさい。修正は5分で終わった。HEARTBEAT.mdに「何もなければHEARTBEAT_OKだけ返せ」って書き足しただけ。でもこういう地味なバグ、リリース前に気づけよって話だ。...
1日前

How we monitor internal coding agents for misalignment
OpenAI News
How OpenAI uses chain-of-thought monitoring to study misalignment in internal coding agents—analyzing real-world deployments to detect risks and strengthen AI safety safeguards.
1日前

VSCodeの言語別の設定が特定のMarkdownファイルだけ反映されないときの解決策
DevelopersIO
VSCodeの言語別の設定が特定のMarkdownファイルだけ反映されないときの解決策
1日前

AIへの作業指示をフェーズに分離したら、未処理が観測可能になった
Zennの「大規模言語モデル」のフィード
数日前にAIがチェックしていた箇所が、今日は素通りされていた。属性の利用が適切かどうか。その観点は、以前のレビューでは指摘が返ってきていた。今日の出力にはその痕跡がない。コードが変わったのか。観点の解釈がブレたのか。そもそも処理されたのか。出力を読んでも判断できなかった。 何が起こったのか原因を調べると、シンプルな事実が出てきた。ファイルの一覧を作らずに実行していた。フォルダを渡し、AIは中身を把握し、そのまま処理に入った。何ファイルを対象にしたか、どのファイルにどの観点を適用したかを記録する工程がなかった。属性利用レビューが実行されたかどうかを確認する手段が、最初から存在し...
1日前

OpenRouter利用量ランキングTOP10を全解説 — 各モデルの系統・用途・開発元まとめ(2026年3月版)
Zennの「大規模言語モデル」のフィード
この記事についてOpenRouterが公開しているAI Model Rankingsは、数百万ユーザーの実利用データに基づくランキングです。ベンチマークスコアではなく「実際にどれだけ使われているか」を示す指標で、開発者が本番環境でどのモデルを選んでいるかがリアルに見えます。この記事では、2026年3月第3週時点のTOP10モデルについて、開発元・国・アーキテクチャ・価格・用途・注意点をまとめました。!モデルのバージョンと価格は急速に変わります。この記事は2026年3月19日時点のスナップショットです。最新はOpenRouter RankingsとOpenRouter M...
1日前

RAG(Retrieval Augmented Generation)の実用的なシステム構成
Zennの「大規模言語モデル」のフィード
RAG(Retrieval Augmented Generation)の実用的なシステム構成RAG(Retrieval Augmented Generation)は、企業向けAIシステムで最も実用化が進んでいる構成の一つです。LLM単体では社内ドキュメントや最新情報を正確に扱うのが難しいため、検索(Retrieval)と生成(Generation)を組み合わせる ことで、回答品質と実用性を高めます。本記事では、RAGをPoCで終わらせず、本番運用まで見据えた 実用的なシステム構成 を整理します。 RAGとはRAGは、ユーザーの質問に対して関連文書を検索し、その検索結果...
1日前

GitHub Agentic Workflowsでドキュメントの自動更新をやってみる
DevelopersIO
GitHub Agentic Workflowsでドキュメントの自動更新をやってみる
1日前

金融営業から内製開発エンジニアへ ― 小さな行動で築いたキャリアの自律
NTT docomo Business Engineers' Blog
はじめに ビジネスdアプリ開発チームの徳原です。 私は地元の金融機関で12年間営業職として勤務した後、IT業界へキャリア転換しました。 本記事では、これまで私が転職で経験したことやキャリアの自律に向けた取り組みについて紹介します。 目次 はじめに これまでのキャリア 金融機関からIT業界へ 前職(外資コンサル)でのSE業務 キャリアを動かしたきっかけ 継続的な学習 前職のインフラ運用業務で苦戦したこと 前職のアプリ開発で苦戦したこと 現職へ転職することになったきっかけ 現職の業務とキャリアの広がり 学習の支援 外部発表の機会 現職のアプリ開発について これまでの経験から感じたキャリアの自律 お…
1日前

OpenClawのモデル選定で月額1/10にした話 — コスパ最適構成の全手順とつまずき集
Zennの「大規模言語モデル」のフィード
この記事についてOpenClaw(旧Clawdbot/Moltbot)を個人で運用している中で、モデル選定とコスト最適化に取り組んだ記録です。Gemini 2.5 Flash単体の構成から、OpenRouter経由のマルチモデル構成に移行した結果、月額コストを約1/10に抑えつつ、品質と安定性を向上させることができました。この記事ではセットアップ中に踏んだ地雷も包み隠さず書いています。同じところでハマる人が減れば幸いです。 この記事で共有していること2026年3月時点のLLMコスパランキング — MiniMax M2.5、DeepSeek V3.2、Grok 4.1 ...
1日前

OpenClawのSkillsを自作して「自分専用AIアシスタント」に育てるまで
Zennの「大規模言語モデル」のフィード
Slack連携の「その先」で詰まった話OpenClawをSlackに入れてみた。質問には答えてくれる。でも、しばらく使っていると気づく。汎用的な受け答えしかしてくれない自社の業務フローを知らない毎回同じ前提を説明するのが面倒「AIアシスタント」と呼ぶには、もう一歩カスタマイズが必要だった。OpenClawにはSkillsという拡張機構がある。これを使って自分の業務に特化した機能を足していく方法を、Docker本番環境の構築も含めて書く。 SKILL.md 1ファイルでSkillが作れるOpenClawのSkillは 1フォルダ = 1スキル。中核は SKILL.m...
1日前

独自LLMを作るには事業会社なら10兆円企業が必要?
3
きしだのHatena
楽天がRakutenAI-3.0を出しましたが、DeepSeek V3アーキテクチャモデルの追加学習モデルのようで、ちょっとそこが話題になってましたね。見せ方の問題もあって、フルスクラッチではないのかと。 https://huggingface.co/Rakuten/RakutenAI-3.0 一応、非公開ではあるけどベースモデルがあることは否定してない模様。 楽天の最新AI、ベースは“中国DeepSeek製”? 担当者に聞いた(1/2 ページ) - ITmedia AI+ で、気になったので、フルスクラッチで独自LLMを作れる企業の規模はどんなものか調べてみました。 日本でフルスクラッチで作…
1日前

gemini embedding 2 による資料の類似性は見た目で決まる? 内容で決まる? PDF と画像で検証してみた
Zennの「大規模言語モデル」のフィード
前回、gemini-embedding-2 を使って、OCR しづらい資料でもそれっぽく近いものを拾えそう、という話を書きました。gemini embedding 2 で "資料単位のナレッジ化" が容易に!?OCRできない見た目の知識をRAG化するhttps://zenn.dev/bekku/articles/5fcbeae4ec5afb今回はその続きとして、もう少し気になっていたことを試しました。それが、PDF や画像のような資料において、embedding は見た目に強く引っ張られるのか、それとも資料中のテキスト内容に強く引っ張られるのか、という点です。加えて、gemin...
1日前

Claude CodeのCLI+VS Code環境をGitHub Codespaces x Amazon Bedrockでシュッと構築してみた
4
DevelopersIO
Claude CodeのCLI+VS Code環境をGitHub Codespaces x Amazon Bedrockでシュッと構築してみた
1日前

生成AIでメンバー育成を『見える化』してみた -- コンテキストエンジニアリングとしてのデータ前処理とエージェント活用
DevelopersIO
フルリモート環境での育成は、メンバーの状況が見えにくい課題があります。散在するデータを Bedrock で収集・構造化し、業務固有のコンテキストを添えて分析することで、育成状況の見える化に取り組んだ話です。
1日前

TerraformでAmazon S3のアカウントリージョナル名前空間バケットを作成してみた
DevelopersIO
TerraformでAmazon S3のアカウントリージョナル名前空間バケットを作成してみた
1日前

Google Home運用テクニック - 橋本商会 - Cosense
橋本商会 - Cosense
Google Homeを運用する上でのテクニックをまとめますshokai.iconok google 今何時 1回前のコマンドを再実行するコマンド 「では、繰り返します。明日の◯◯の天気は雨です」 2023年ぐらいからずっとバグっている 前のコマンドから長い時間が経過している場合だけ、時刻を教えてくれるok google もういいよ 昔は再生中のニュースや音楽、目覚ましを解除するコマンドだったが 2024年ごろから「こっちのけんとのもういいよを再生します」に変化した 代わりに「ok google もうやめて」を使うようになったshokai.iconok googleアラームを解除してok googleタイマーを解除して 目覚ましを解除できたり、できなかったりするコマンド
1日前

仮想待合室 SaaS "NetFUNNEL" に入門してみた ~CloudFront連携がとても簡単だった件~
DevelopersIO
仮想待合室 SaaS "NetFUNNEL" に入門してみた ~CloudFront連携がとても簡単だった件~
1日前

Okta連携でSnowflake Intelligence(AIチャット)だけをユーザーに開放してみた
DevelopersIO
Okta連携でSnowflake Intelligence(AIチャット)だけをユーザーに開放してみた
1日前

ブレインパッドOBがプロスポーツチームのデジタルマーケターへ転身!「データ×熱狂」で地域に「応援する文化」を創り出すデジマ最前線
Platinum Data Blog by BrainPad ブレインパッド
ブレインパッドが2024年8月に設立したアルムナイネットワーク「ブレインパッド アルムナイ・グラフ(以下:BAG)」。BAGは、ブレインパッドを退職した社員(以下、卒業生)と在籍中の社員の交流を生む施策を中心に、卒業生同士のつながりの醸成や、社員がキャリアを考える機会を提供することなどを目的に活動しています。● 2024年8月28日 株式会社ブレインパッド発表ブレインパッド、アルムナイネットワーク「BAG」を設立、第1回交流イベントを開催- 人材輩出企業として卒業生を応援、退職後もともにデータ活用の普及を促進 -今回より、「“BrainPad Career Junction”~ブレインパッド卒業生とともに広げる、データ/AI活用の輪~」と銘打ち、ブレインパッドの卒業生が今どのような活躍をしているのか、どのようにデータ活用の輪を社会に広げているのかをお伝えしていきます。第1弾として、2023年にブレインパッドを卒業し、現在はプロスポーツチームにてデジタルマーケティングを担当されている中島さんからお話を伺いました。熱狂を生むデジマの最前線!プロスポーツチームで挑む挑戦の日々データサイエンテ
1日前

作って、捨てて、また作る - Claude Code に社内ツールの開発を丸ごと任せた49日間の記録
1
DevelopersIO
Claude Code に社内ツールの開発を丸ごと任せた49日間の記録です。アーキテクチャを途中で変え、10日間で111タスクを実装し、2,755件のテストが通ったものの、採用したプラットフォームの構造的な速度制限により本番採用を見送りました。高速に作って、高速に失敗して、次に活かす。AI 駆動開発で「撤退判断」まで行った体験記です。(読み終わるまでの時間:20分程度)
1日前

【アップデート】AWS Config マネージドルールに 75 ルールが追加されました!
DevelopersIO
【アップデート】AWS Config マネージドルールに 75 ルールが追加されました!
2日前

AIを活用した大規模iOSアプリのSwift Concurrency移行戦略
1
Sansan Tech Blog
はじめに こんにちは!技術本部 Sansan Engineering Unit Mobile Application Groupに所属するiOSエンジニアの劉 志輝です。 今回は、ビジネスデータベース「Sansan」のiOSアプリで進めている、Swift6時代に向けたSwift Concurrencyへの移行戦略についてお話しします。 このアプリは10年以上にわたって継続開発されており、UIKit + VIPERアーキテクチャで構成されています。 非同期処理にはRxSwift(Single、Observable、BehaviorRelay)とGCD(DispatchSemaphore、Disp…
2日前

OpenAI to acquire Astral OpenAI News
Accelerates Codex growth to power the next generation of Python developer tools
2日前

カケハシ入社半年で感じたこと
KAKEHASHI Tech Blog
はじめに はじめまして、竹浪と申します。2025年8月にカケハシへエンジニアとして入社しました。 現在は Pocket Musubi チームに所属しています。この記事では、入社の経緯や、半年間で感じたことをお伝えできればと思います。 自己紹介・これまでの経歴 1999年に専門学校を卒業後、SI系の会社でエンジニアとしてのキャリアをスタートしました。翌年にはフリーランスに転向し、その後メガベンチャーを含むWeb企業を経て、複数のスタートアップでの開発にも携わってきました。 技術スタックとしては Go、Java、PHP を中心としたバックエンド開発が主軸で、AWS や GCP を活用したインフラの…
2日前

【非エンジニアのためのClaude/ClaudeCodeシリーズ 】 Anthropic公式の"salesプラグイン"全部試してみた
20
DevelopersIO
Claude上で使えるAnthropicの公式プラグイン"Salesプラグイン”の全機能を試してみました。
2日前

Autoresearching Apple's "LLM in a Flash" to run Qwen 397B locally Simon Willison's Weblog
<p><strong><a href="https://twitter.com/danveloper/status/2034353876753592372">Autoresearching Apple&#x27;s &quot;LLM in a Flash&quot; to run Qwen 397B locally</a></strong></p>Here's a fascinating piece of research by Dan Woods, who managed to get a custom version of <a href="https://huggingface.co/Qwen/Qwen3.5-397B-A17B/tree/main">Qwen3.5-397B-A17B</a> running at 5.5+ tokens/second on a 48GB MacBook Pro M3 Max despite that model takin...
2日前

AI Agentの本番運用を通して学んだ3つのガードレール
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の135週目の記事です!3年間連続達成まで残り24週となりました! はじめに:AI Agentは「動かす」より「安定させる」が難しいこんにちは、ログラスでエンジニアしている山崎です。私は2025年11月に入社して以来、AI Agentの新規事業の開発をしています。私たちはLangGraphでAI Agentを構築し、経営の実績データに対する分析コメント(以下、財務分析コメント)をLLMに生成させる機能を開発・運用しています。なお、本機能で利用するLLM APIは、入力データがモデル...
2日前

Amazon Connect AIエージェントで質問内容に応じて複数のナレッジベースを使い分ける(選択的クエリ)方法
DevelopersIO
Amazon Connect AIエージェントで質問内容に応じて複数のナレッジベースを使い分ける(選択的クエリ)方法
2日前

[アップデート] Kiro エンタープライズユーザー(IAM Identity Center 利用)でもオープンウェイトモデルが利用できるようになりました
DevelopersIO
[アップデート] Kiro エンタープライズユーザー(IAM Identity Center 利用)でもオープンウェイトモデルが利用できるようになりました
2日前

GlassWorm Sleeper Extensions Activate on Open VSX, Shift to GitHub-Hosted VSIX Malware
Socket
We identified over 20 additional malicious extensions, along with over 20 related sleeper extensions, some of which have already been weaponized.
2日前

Snowflake Cortex AI Escapes Sandbox and Executes Malware Simon Willison's Weblog
<p><strong><a href="https://www.promptarmor.com/resources/snowflake-ai-escapes-sandbox-and-executes-malware">Snowflake Cortex AI Escapes Sandbox and Executes Malware</a></strong></p>PromptArmor report on a prompt injection attack chain in Snowflake's <a href="https://docs.snowflake.com/en/user-guide/snowflake-cortex/cortex-agents">Cortex Agent</a>, now fixed.</p><p>The attack started when a Cortex user asked the agent to review a GitHu...
2日前

既存の MCP サーバーを MCP Apps 対応させて、Claude Desktop にインタラクティブ UI を表示してみた
DevelopersIO
既存の MCP サーバーを MCP Apps 対応させて、Claude Desktop にインタラクティブ UI を表示してみた
2日前

Node.js互換でコンテナよりも高密度と高速起動を実現する「Edge.js」、Wasmerが発表
Publickey
WebAssemblyランタイム「Wasmer」を開発提供するWasmer社は、Node.js互換かつコンテナよりも高密度な集約と高速起動を実現する「[Edge.js](https://edgejs.org/)」を発表しました。 What ...
2日前
3/18 (水)

What Is the PARK Stack?
Radar
Background: Stacks with four-letter acronyms According to Wikipedia, the LAMP stack was coined in 1998 by Michael Kunze to describe what had emerged as a popular open source software stack for websites. When the World Wide Web exploded in popularity earlier in the ’90s, organizations used an ad hoc mixture of proprietary tools and operating […]
2日前

LINEヤフーのエンジニアの動向を知る:State of LY 2025実施レポート LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフーでは、2024年に引き続き、2025年も社内の開発者を対象としたアンケート「State of LY 2025」を実施しました(昨年度の実施レポート)。昨年はWebフロントエンド開発者のみ...
2日前

LINE iOSアプリにWebKitの新API「WebPage」を導入できず、自前で実装した件 LINEヤフー Tech Blog (LY Corporation Tech Blog
はじめにこんにちは、iOSアプリエンジニアのKiichiです。LINE iOSアプリでアプリ内ブラウザなど、Webまわりの開発を担当しています。普段はUIKitをベースに機能改善や新機能開発を進めつつ...
3日前

cdk8s の Helm 実行結果をキャッシュしてマニフェスト生成を高速化した
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone 生成 AI チームで連載中の kintone AI リレーブログ 2026 の 10 本目の記事です。リレーブログでは生成 AI チームのメンバーが AI トピックに限らず、さまざまなことについて発信していきます。こんにちは! kintone の生成 AI チームでソフトウェアエンジニアをやっている福田です。私たちのチームでは cdk8s を使って Kubernetes マニフェストを管理しています。(cdk8s の詳細は別の記事で紹介していますので、あわせてご覧ください。)cdk8s を使うと TypeScript でマニフェストが書けるだけでなく、Helm チャートと統合したマニフェスト管理も簡単に行うことができて非常に便利なのですが、YAML のマニフェスト生成に時間がかかることがチーム内でも問題になっていました。Kubernetes へのデプロイは、cdk8s で生成した YAML のマニフェストを apply するという方法で行っており、その生成に時間がかかってしまうと、開発のイテレーションが遅くなってしまいます。今回はマニフェスト生成が遅いという
3日前

2026年4月の技術系イベント予定 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...
3日前

Nemotron 3 Nano 4Bを試す。Qwen3.5やQwen3のほうがいいかも
きしだのHatena
Nemotron 3 Nano 4Bというのが出ていたので、Q8_0で試してみます。 Nemotron 3 Nano 4B: A Compact Hybrid Model for Efficient Local AI 結論でいうと、Qwen3-4BやQwen3.5-4Bよりいい点はあまり見当たりませんでした。 知識カットオフは? 2024-6っぽいけど、なかなか・・・ 「きしだ」というのはあってそうだけど、 Qwen3.5-4Bは、石破さんは102代だけどだいたいあってて、知識も新しい。 Qwen3-4Bは読み方以外は正しい。知識はちょい古い。 日本知識 どこのことを言ってる? Qwen3.5…
3日前

Sansanのデータ化オペレーションを支えるデータ基盤hydra
Sansan Tech Blog
技術本部Digitization部Platform Engineeringグループの湯村です。Sansanでは、名刺や請求書などの情報を正確なデータへ変換するために、AIによる自動処理と人による補正を組み合わせた大規模な運用体制を構築しています。この記事では、こうしたデータ化の運用を拡大する中で直面した課題と、それを解決するために構築したデータ基盤hydraの設計について紹介します。
3日前

「自分でやり切る」だけでチームは強くならない
NTT docomo Business Engineers' Blog
NTTドコモビジネス イノベーションセンター テクノロジー部門 MetemcyberPJでの経験を通じ、私は「自分でやり切ること」と「チームとして成果を出すこと」のバランスの重要性を学びました。若手社員でも幅広い業務に挑戦できる環境の中で、責任感を持ちながらも周囲と協力することで、個人の成長とチーム成果の両立が可能であると実感しています。この記事では、その経験から得た学びと実践のポイントを紹介します。 はじめに 若手でも幅広く挑戦できる環境 スクラムという前提 私が経験した「抱え込み」 タスクの優先順位のつけ方 最後に はじめに こんにちは。イノベーションセンター テクノロジー部門 Metem…
3日前

40,000行のAPIテスト作成で学んだClaude Code Skillsの育て方
カミナシ エンジニアブログ
こんにちは、ソフトウェアエンジニアの渡邉(匠)です。「カミナシ 設備保全」の開発に携わっています。 Claude CodeのSkills(以下スキル)を使い、約2週間で40,000行超のAPIシナリオテストを書き切りました。最初のスキルは粗削りでしたが、テストを量産する中で繰り返し改善した結果、後半は「スキル実行 → レビュー → マージ」のサイクルだけで回せるようになりました。 この記事では、スキルをどう設計し、どう育てたかを中心にお伝えします。 背景 APIの動作保証にシナリオテストツール runn を使っていました。 サービス成長に伴うAPIの増加により、当初のテスト構成では運用が回らな…
3日前

Quoting Ken Jin Simon Willison's Weblog
<blockquote cite="https://fidget-spinner.github.io/posts/jit-on-track.html"><p>Great news—we’ve hit our (very modest) performance goals for the CPython JIT over a year early for macOS AArch64, and a few months early for x86_64 Linux. The 3.15 alpha JIT is about <strong>11-12%</strong> faster on macOS AArch64 than the tail calling interpreter, and <strong>5-6%</strong>faster than the standard interpreter on x86_64 Linux.</p></blockquote><p class...
3日前

GPT-5.4 mini and GPT-5.4 nano, which can describe 76,000 photos for $52 Simon Willison's Weblog
<p>OpenAI today: <a href="https://openai.com/index/introducing-gpt-5-4-mini-and-nano/">Introducing GPT‑5.4 mini and nano</a>. These models join GPT-5.4 which was released <a href="https://openai.com/index/introducing-gpt-5-4/">two weeks ago</a>.</p><p>OpenAI's self-reported benchmarks show the new 5.4-nano out-performing their previous GPT-5 mini model when run at maximum reasoning effort. The new mini is also 2x faster than the previous mini.</p>...
3日前

Improving breast cancer screening workflows with machine learning
The latest research from Google
Health & Bioscience
3日前

Quoting Tim Schilling Simon Willison's Weblog
<blockquote cite="https://www.better-simple.com/django/2026/03/16/give-django-your-time-and-money/"><p>If you do not understand the ticket, if you do not understand the solution, or if you do not understand the feedback on your PR, then your use of LLM is hurting Django as a whole. [...]</p><p>For a reviewer, it’s demoralizing to communicate with a facade of a human.</p><p>This is because contributing to open source, especially Django, is a communal endeavor....
3日前

JavaにJavaScriptエンジン「V8」とPythonランタイム「CPython」を組み込む「Project Detroit」、オラクルが発表
Publickey
オラクルは、カリフォルニア州レッドウッドシティで開幕したイベント「JavaOne 2026」で、「Project Detroit」(以下、Detroit)をOpenJDKのプロジェクトプロポーザル(プロジェクト提案)として発表しました。 D...
3日前

福岡Rubyist会議05に行ってきました!
Timee Product Team Blog
福岡Rubyist会議05 参加レポート こんにちは!Timeeでバックエンドエンジニアをしている志賀(@akitoshiga)です。 表題の通り「福岡Rubyist会議05 」に参加してきたのでそちらのレポートを書きたいと思います! regional.rubykaigi.org 今回「Kaigi Pass」という社内制度を利用して参加しました。 「Kaigi Pass」とは、世界中で開催されているすべての技術カンファレンスに無制限で参加できる制度です。 productpr.timee.co.jp 会場の様子 当日は福岡県福岡市博多区にある「リファレンス駅東ビル」というところで行われました。 …
3日前

「Java 26」正式リリース。HotSpotの起動高速化、HTTP/3クライアント対応など新機能
Publickey
オラクルはJavaの最新バージョン「Java 26」正式版のリリースを発表しました。日本時間で今日(2026年3月18日)未明にカリフォルニア州レッドウッドシティで開幕したJavaOne 2026でも、Java 26のリリースが紹介されまし...
3日前
3/17 (火)

Subagents Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>LLMs are restricted by their <strong>context limit</strong> - how many tokens they can fit in their working memory at any given time. These values have not increased much over the past two years even as the LLMs themselves have seen dramatic improvements in their abilities - they generally top out at around 1,...
3日前

Stop Closing the Door. Fix the House.
Radar
The following article originally appeared on Angie Jones’s website and is being republished here with the author’s permission. I’ve been seeing more and more open source maintainers throwing up their hands over AI-generated pull requests. Going so far as to stop accepting PRs from external contributors. If you’re an open source maintainer, you’ve felt this […]
3日前

OpenAI Japan announces Japan Teen Safety Blueprint to put teen safety first OpenAI News
OpenAI Japan announces the Japan Teen Safety Blueprint, introducing stronger age protections, parental controls, and well-being safeguards for teens using generative AI.
3日前

Introducing GPT-5.4 mini and nano OpenAI News
GPT-5.4 mini and nano are smaller, faster versions of GPT-5.4 optimized for coding, tool use, multimodal reasoning, and high-volume API and sub-agent workloads.
3日前

ai.rakuten.co.jpで動いてるのはSonnet?->GPT系っぽい
2
きしだのHatena
楽天からRakutenAI-3.0がApache 2.0ライセンスで公開されていました。DeepSeek V3アーキテクチャの671B-A37Bのモデルです。 https://huggingface.co/Rakuten/RakutenAI-3.0 ということで、とりあえずai.rakutenで試してみようと思ったのですね。自社のフラグシップモデルを使ってるだろうと思って。 https://ai.rakuten.co.jp/chat で、ブロック崩しを作ってもらったら、こういうきれいなブロック崩しを作ってきました。 パーティクルだけ後付け。 「おぉすごい」と思ったのだけど、いろいろ試すと、ちょ…
3日前

Vol.12 GKEにIAPを適用してコア機能に集中しよう
Sansan Tech Blog
技術本部Data Intelligence Engineering Unitのスタッフソフトウェアエンジニア藤原です。 Sansan Data Intelligence開発Unitブログリレーのvol.12として、少し趣向を変えて、今日はGoogle Cloudのちょっとだけマニアックだけど便利な機能、IAP(Identity-Aware Proxy)の活用について紹介します。
3日前

ベクトル検索エンジンValdの長期運用で見えたパフォーマンス最適化とベストプラクティス
2LINEヤフー Tech Blog (LY Corporation Tech Blog
はじめに私たちは、社内のプラットフォームにおいて、Cloud NativeなANN(近似最近傍探索)ベクトル検索エンジン「Vald」のマネージドシステムを約4年間にわたり運用・開発してきました。本記事...
4日前

Equipping workers with insights about compensation OpenAI News
New research shows Americans send nearly 3 million daily messages to ChatGPT asking about compensation and earnings, helping close the wage information gap.
4日前

Async React の設計思想と Signal の違いを Transition を中心に考える
29
KAKEHASHI Tech Blog
ランキング参加中プログラミング こんにちは。フロントエンドエンジニアをしているNokogiri(@nkgrnkgr)です。 はじめに 私たちのReactをつかったプロダクトでは Suspense をデータフェッチに利用しています。useTransition や useOptimistic も触ったことはありましたが、プロダクションでどう活かすかという解像度がまだ上がっていませんでした。 そんなとき、uhyo さんの「React 19時代のコンポーネント設計ベストプラクティス」や「Async Reactとは何か」を読んで、Async React の全体像をちゃんと理解したくなりました。実際にコー…
4日前

Introducing Mistral Small 4
Simon Willison's Weblog
<p><strong><a href="https://mistral.ai/news/mistral-small-4">Introducing Mistral Small 4</a></strong></p>Big new release from Mistral today (despite the name) - a new Apache 2 licensed 119B parameter (Mixture-of-Experts, 6B active) model which they describe like this:</p><blockquote><p>Mistral Small 4 is the first Mistral model to unify the capabilities of our flagship models, Magistral for reasoning, Pixtral for multimodal, and Devstral for...
4日前

Use subagents and custom agents in Codex Simon Willison's Weblog
<p><strong><a href="https://developers.openai.com/codex/subagents">Use subagents and custom agents in Codex</a></strong></p>Subagents were announced in general availability today for OpenAI Codex, after several weeks of preview behind a feature flag.</p><p>They're very similar to the Claude Code implementation, with default subagents for "explorer", "worker" and "default". It's unclear to me what the difference between "worker" and "default" is bu...
4日前

Quoting A member of Anthropic’s alignment-science team Simon Willison's Weblog
<blockquote cite="https://www.newyorker.com/news/annals-of-inquiry/the-pentagon-went-to-war-with-anthropic-whats-really-at-stake?_sp=9a6e0ff7-2bfd-46f8-a9e1-3941ef2003b5.1773495048769"><p>The point of <a href="https://simonwillison.net/2025/Jun/20/agentic-misalignment/">the blackmail exercise</a> was to have something to describe to policymakers—results that are visceral enough to land with people, and make misalignment risk actually salient in practice for people who ha...
4日前

Quoting Guilherme Rambo Simon Willison's Weblog
<blockquote cite="https://daringfireball.net/2026/03/apple_enclaves_neo_camera_indicator"><p>Tidbit: the software-based camera indicator light in the MacBook Neo runs in the secure exclave¹ part of the chip, so it is almost as secure as the hardware indicator light. What that means in practice is that even a kernel-level exploit would not be able to turn on the camera without the light appearing on screen. It runs in a privileged environment separate from the kernel and blits the li...
4日前

Coding agents for data analysis Simon Willison's Weblog
<p><strong><a href="https://simonw.github.io/nicar-2026-coding-agents/">Coding agents for data analysis</a></strong></p>Here's the handout I prepared for my NICAR 2026 workshop "Coding agents for data analysis" - a three hour session aimed at data journalists demonstrating ways that tools like Claude Code and OpenAI Codex can be used to explore, analyze and clean data.</p><p>Here's the table of contents:</p><blockquote><ul><li...
4日前

Testing LLMs on superconductivity research questions
The latest research from Google
Education Innovation
4日前

データセンターが武力紛争時の攻撃目標になる時代。中東の武力紛争で両陣営ともにデータセンターを狙った攻撃を実行
Publickey
日本時間3月1日に行われた米国とイスラエルによるイランへの攻撃開始から約2週間が経過した中東における武力紛争は、データセンターが明確な攻撃目標としてクローズアップされた歴史上初めての武力紛争になりました。 この紛争における両陣営のデータセン...
4日前
3/16 (月)

How coding agents work Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>As with any tool, understanding how <a href="https://simonwillison.net/guides/agentic-engineering-patterns/what-is-agentic-engineering/">coding agents</a> work under the hood can help you make better decisions about how to apply them.</p><p>A coding agent is a piece of software that acts as a <s...
4日前

A Fraudster’s Paradise
Radar
Dark web forum posts mentioned the phrase “AI agent” far more in the second half of 2025 than in the first half. Could this mean that fraudsters are charmed by the AI hype? Or is AI truly a game changer for cybercrime? AI-related discussions—evident both in what “the bad guys” are saying and in what […]
4日前

TC39 Advances Temporal to Stage 4 Alongside Several ECMAScript Proposals
Socket
TC39’s March 2026 meeting advanced eight ECMAScript proposals, including Temporal reaching Stage 4 and securing its place in the ECMAScript 2026 specification.
5日前

「LINEヤフー Development with Agents Meetup #2」を開催しました!(イベントレポート) LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。LINEヤフーの永吉です。2月24日(火)、「LINEヤフー Development with Agents Meetup #2」を開催しました。今回のMeetupは、Orchestrat...
5日前

わずか9秒の「事前タスク」でクラウドソーシング実験のデータ品質向上(CHI 2026採択論文解説) LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。LINEヤフー研究所でヒューマンコンピュータインタラクション(HCI)分野の研究をしている山中です。クラウドソーシングで収集したデータを使って、とても精度が良いとされているモデルに当てはめ...
5日前

Vol. 24 Bill One開発Unit ブログリレー2025終幕
Sansan Tech Blog
はじめに こんにちは!技術本部 Bill One Engineering Unitの今村です。2025年4月に新卒でSansanに入社しました。あと少しで入社して1年が経つところです。 2025年11月12日に投稿した「Vol. 00 Bill One開発Unit ブログリレー2025を開催!& アーキテクチャConference 2025に協賛します!」で言及した通り、Bill One開発Unit ブログリレー2025を実施しました。エンジニアに加えて、デザイナーやQA、Bill Oneのプロダクト開発責任者など、多くのメンバーが参加し計24本のブログを執筆しました。 本記事では、ブログリレ…
5日前

Why Codex Security Doesn’t Include a SAST Report OpenAI News
A deep dive into why Codex Security doesn’t rely on traditional SAST, instead using AI-driven constraint reasoning and validation to find real vulnerabilities with fewer false positives.
5日前

What is agentic engineering? Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>I use the term <strong>agentic engineering</strong> to describe the practice of developing software with the assistance of coding agents.</p><p>What are <strong>coding agents</strong>? They're agents that can both write and execute code. Popular examples include <a href="https://code...
5日前

ViteネイティブなWebプラットフォーム「Void」発表。Cloudflareの上に構築されたフルスタックの実行環境
Publickey
JavaScriptのバンドルツール「Vite」などを開発しているVoidZeroは、ViteからシームレスにデプロイできるViteネイティブなWebアプリケーションプラットフォーム「Void」を発表しました。 VoidはCloudflar...
5日前
JavaScriptの統合ツールチェーン「Vite+」がオープンソースで公開
Publickey
JavaScriptのESモジュールに対応した高速なビルドツール「Vite」などを開発しているVoidZeroは、Viteを含むJavaScriptの統合開発ツールチェーン「Vite+」アルファ版をオープンソースで公開しました(GitHub...
5日前

ビルドツール「Vite 8.0」正式リリース。Rustベースの新バンドラ「Rolldown」採用でより一貫した動作や最適化を実現
Publickey
JavaScriptのESモジュールに対応した高速なビルドツール「Vite」の最新版「Vite 8.0」正式版がリリースされました。 Vite 8.0 is here!The most significant architectural ...
5日前
3/15 (日)

Quoting Jannis Leidel Simon Willison's Weblog
<blockquote cite="https://jazzband.co/news/2026/03/14/sunsetting-jazzband"><p>GitHub’s <a href="https://www.theregister.com/2026/02/18/godot_maintainers_struggle_with_draining/">slopocalypse</a> – the flood of AI-generated spam PRs and issues – has made Jazzband’s model of open membership and shared push access untenable.</p><p>Jazzband was designed for a world where the worst case was someone accidentally merging the wrong PR. In a world where <a href="ht...
6日前

My fireside chat about agentic engineering at the Pragmatic Summit Simon Willison's Weblog
<p>I was a speaker last month at the <a href="https://www.pragmaticsummit.com/">Pragmatic Summit</a> in San Francisco, where I participated in a fireside chat session about <a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering</a> hosted by Eric Lui from Statsig.</p><p>The video is <a href="https://www.youtube.com/watch?v=owmJyKVu5f8">available on YouTube</a>. Here are my highlights from the conversatio...
6日前
3/14 (土)

FASTとスクラムに学ぶ、不確実性への2つのアプローチ
株式会社ログラス テックブログのフィード
はじめに現代のソフトウェア開発において、「先のことを正確に予測する」 ことが、かつてないほど難しくなっていると感じませんか?時間をかけて精緻なスケジュールを引いても、開発を始めた途端に前提条件が変わることは、もはや当たり前になってきました。意図しなかった技術的な依存関係が見つかる、ステークホルダーの要望が変化する、競合他社が予期せぬ機能をリリースする。そして、仮に予定通りに作りきったとしても、そもそも使ってもらえない。このように「当初の計画通りに進まない」という事象は、VUCA と呼ばれる時代においては避けて通ることが難しくなってきています。この記事では、私が実践してきた...
6日前

Anker USB-C & USB-C Thunderbolt 4 100W ケーブル 0.7m - 橋本商会 - Cosense
橋本商会 - Cosense
8Kの映像が出せて、同時に100WでUSB Power Deliveryで充電もできるUSB-Cケーブルhttps://www.ankerjapan.com/products/a8859JapanNext 31.5インチモニタ JN-IPS315UHDR-C90W-HSPのために買った
6日前

JapanNext 31.5インチモニタ JN-IPS315UHDR-C90W-HSP - 橋本商会 - Cosense
橋本商会 - Cosense
9年使ったiiyama 31.5インチモニタ X3291HS-B1から買い替えたshokai.icon Retinaディスプレイで撮影した画像の正しいスケールでの表示ができるようになったら ようやく普段使っている液晶ディスプレイの解像度が気になってきた為#買ったサイズ感は同じだが、dpiが縦も横も2倍になった 文字が読みやすすぎてワロタshokai.iconhttps://jp.japannext.com/products/jn-ips315uhdr-c90w-hsphttps://www.yodobashi.com/product/100000001008680260/ 5.4万円モニタ付属の新しいHDMIケーブルでは、4k 30Hz出力しかできなかった
6日前

72 Malicious Open VSX Extensions Linked to GlassWorm Campaign Now Using Transitive Dependencies
Socket
Since January 31, 2026, we identified at least 72 additional malicious Open VSX extensions, including transitive GlassWorm loader extensions targeting developers.
7日前

Software Craftsmanship in the Age of AI
Radar
On March 26, Addy Osmani and I are hosting the third O’Reilly AI Codecon, and this time we’re taking on the question of what software craftsmanship looks like when AI agents are writing much of the code. The subtitle of this event, “Software Craftsmanship in the Age of AI,” was meant to be provocative. Craftsmanship […]
7日前

1M context is now generally available for Opus 4.6 and Sonnet 4.6 Simon Willison's Weblog
<p><strong><a href="https://claude.com/blog/1m-context-ga">1M context is now generally available for Opus 4.6 and Sonnet 4.6</a></strong></p>Here's what surprised me:</p><blockquote><p>Standard pricing now applies across the full 1M window for both models, with no long-context premium.</p></blockquote><p>OpenAI and Gemini both <a href="https://www.llm-prices.com/#sel=gemini-3-1-pro-preview-200k%2Cgpt-5.4-272k%2Cgemini-3-...
7日前

Quoting Craig Mod Simon Willison's Weblog
<blockquote cite="https://craigmod.com/essays/software_bonkers/"><p>Simply put: It’s a big mess, and no off-the-shelf accounting software does what I need. So after years of pain, I finally sat down last week and started to build my own. It took me about five days. I am now using the best piece of accounting software I’ve ever used. It’s blazing fast. Entirely local. Handles multiple currencies and pulls daily (historical) conversion rates. It’s able to ingest any CSV I throw at it ...
7日前










