直近1週間の更新
3/12 (木)

MCP AppsをHono × React × Lambdaで作って、AIで商品を絞り込めるアプリを作ってみた
DevelopersIO
MCP AppsをHono × React × Lambdaで作って、AIで商品を絞り込めるアプリを作ってみた
1時間前

AWS Backup으로 EC2 백업 시 스냅샷이 2배로 생성되는 이유
DevelopersIO
AWS Backup으로 EC2 백업 시 스냅샷이 2배로 생성되는 이유에 대해서 조사해 봤습니다.
2時間前

Google Workspace CLIの--sanitizeフラグでModel Armorを使ってみた
DevelopersIO
Google Workspace CLIの--sanitizeフラグでModel Armorを使ってみた
2時間前

NVIDIA が最新オープンモデル Nemotron 3 Super を発表したので Cloudflare Workers AI で試してみた
DevelopersIO
NVIDIA が新たな 1200 億パラメータの Nemotron 3 Super を発表しました。すぐに Cloudflare Workers AI で使用可能になっていたので試してみました。
2時間前

LLMはGMになれるのか?Claude CodeでTRPGソロプレイ環境を構築した話
Zennの「大規模言語モデル」のフィード
はじめに「Claudeで何か遊べないかな」——日常的にClaudeを使っていると、ふとそんなことを考えます。そこで思いついたのが、ClaudeにTRPGのGM(ゲームマスター)をやらせてソロプレイすることでした。この記事では、LLM(Claude)にTRPGのGMを任せてソロプレイを実現するまでの過程と、そこから見えてきたLLM-GM(LLMをGMとして使う運用)の設計原則3つを紹介します。題材に選んだのは「ニンジャスレイヤーTRPG」。サイバーパンク×ニンジャという独特の世界観を持つ小説「ニンジャスレイヤー」を下敷きにしたTRPGです。無料のチュートリアルシナリオが公...
3時間前

【新卒入社リアルレポート:2025年4月入社編】データサイエンスの最前線で何を感じた? 入社動機から研修、現場での成長を振り返り!
Platinum Data Blog by BrainPad ブレインパッド
今回は2025年度に入社した新卒社員3名に集まってもらい、入社から約1年が経った今のリアルな心境を語ってもらいました。 株式会社ブレインパッドのデータサイエンティスト、エンジニア、そしてグループ会社である株式会社TimeTechnologiesのカスタマーサクセスと、異なる職種で活躍する新卒1年目のメンバーが「新卒研修のリアル」や「現場での成長」、そして「将来」について振り返ります。岩撫 映見いわなで えみ 有井 鴻太ありい こうた 内海 圭喬うつみ けいすけ 東海大学大学院情報通信学研究科情報通信学専攻 卒業株式会社ブレインパッドデータサイエンティスト 学習院大学国際社会科学部国際社会科学科 卒業株式会社TimeTechnologiesカスタマーサクセス 会津大学大学院コンピュータ理工学研究科コンピュータ・情報システム学専攻 卒業株式会社ブレインパッドプロダクト開発エンジニア それぞれの入社の決め手は?「もっとやっておけばよかった」 新卒研修のリアルな振り返り配属後の「まさか」と「成長」未来の自分へ:目指す姿とスキル未来の仲間へのメッセージ(最後に雑談・・・おすすめの福利厚生のご紹介
3時間前

[アップデート] AWS BackupによるAmazon RDS マルチAZ DBクラスターのバックアップが、大阪リージョンを含む追加の17リージョンで利用可能になりました
DevelopersIO
[アップデート] AWS BackupによるAmazon RDS マルチAZ DBクラスターのバックアップが、大阪リージョンを含む追加の17リージョンで利用可能になりました
4時間前
【RAG入門②】RAGのチャンク・ベクトル・類似度の中身を覗く
Zennの「大規模言語モデル」のフィード
はじめに前回の記事では、PythonとOllamaを使ってRAGをゼロから実装しました。今回は、前回のコードをベースに、チャンク・ベクトル・類似度の内容を確認します。今回行うことチャンクがどう分割されているかを可視化するベクトル(埋め込み)の値を確認し、2D散布図で意味の近さを確認する類似度スコアの全体分布を眺め、なぜそのチャンクが選ばれるかを理解する!この記事は前回の続きです。環境構築(Ollamaのインストール、モデルのダウンロード)は前回の記事を参照してください。コードはGitHubで公開しています。https://github.com/norma2...
4時間前

AI活用によりノンエンジニアが実装に参画し、双方向に役割を越境するチームへと発展した話
Sansan Tech Blog
こんにちは!Digitization部の宮野隼吏です。Digitization部所属ですが、エンジニアではありません。コードは1行も書けません。そんな私がAIを活用してライトなUI/UX改善や機能実装をし始めた結果、チームでどんな変化が起きたかをお話しします。 3行サマリ チームの現在地 フェーズ1:Devin AIによる自律的実装を試みた時期 フェーズ2:Cursorによる「手触り感」を持った開発へ エンジニアの価値を最大化し、双方向に越境する 最後に 一緒に挑戦してくれる仲間を募集中です 3行サマリ ノンエンジニアがCursorやDevin AIを活用して一部実装、ステージング検証まででき…
4時間前

Gitリポジトリのサブディレクトリ以下のみをDevContainer化した際に、Gitも使いたい
1
DevelopersIO
Gitリポジトリのサブディレクトリ以下のみをDevContainer化した際に、Gitも使いたい
5時間前

チームで本格的に Docs as Code を運用しているので紹介します
17
エムスリーテックブログ
エムスリーのソフトウェアエンジニアの伊藤です。デジスマチームのブログリレー2日目の記事です。 チームではチームリーディングとプロダクトマネジメントを主に担当しています。 はじめに コンテキスト・エンジニアリング AI Ready なコードベースにするためのドキュメント管理 プロダクト画面仕様書 ADR Design Doc API 定義 (Protocol Buffers) まとめ We are Hiring! エンジニア採用ページはこちら エンジニア新卒採用サイト! ! カジュアル面談! !
5時間前

GCVE Launches Decentralized Publishing Ecosystem for Vulnerability Disclosure
Socket
The GCVE initiative operated by CIRCL has officially opened its publishing ecosystem, letting organizations issue and share vulnerability identifiers without routing through a central authority.
5時間前

Petco Bets on Highly Engaged Pet Parents to Ignite Growth
PYMNTS.com
Petco plans to expand the range of consumables, supplies and services it offers for pets as it moves into the next phase of its operational plan, shifting its focus from cost savings to growth, Petco CEO Joel Anderson said Wednesday (March 11) during the company’s fourth quarter earnings call. The company completed the first […]The post Petco Bets on Highly Engaged Pet Parents to Ignite Growth appeared first on PYMNTS.com.
6時間前

Amazon Injunction Could Change the Future of Agentic Commerce
PYMNTS.com
Amazon won an early legal victory this week when a federal judge issued a preliminary injunction blocking Perplexity from using the Comet browser’s artificial intelligence shopping agent to access password-protected parts of Amazon’s site and make purchases on behalf of users. The order, handed down Monday by U.S. District Judge Maxine Chesney in Northern […]The post Amazon Injunction Could Change the Future of Agentic Commerce appeared first on PYMNTS.com.
7時間前

LLMにちゃんと“電卓と検索”を使わせるには — ReActスタイルのツール利用・実装入門
Zennの「大規模言語モデル」のフィード
はじめにルミナイR&Dチームの栗原です。最近の LLM は、テキストを出すだけでなく、電卓Web 検索社内 APIデータベースなど、**外部ツールを叩きながらタスクをこなす「エージェント」**として使われることが増えています。ただ、「いつツールを呼ぶべきか?」「どの引数で呼ぶべきか?」「ツールの結果をどう踏まえて次のアクションを決めるか?」といった “段取り”のデザイン を考えると、途端に設計が難しくなります。この文脈でよく引用されるのが、ICLR 2023 の論文ReAct: Synergizing Reasoning and Actin...
7時間前

Build an AI Agent from Scratch (No Frameworks, Just Python)
Zennの「大規模言語モデル」のフィード
日本語版はこちらBuilding a fully functional AI agent in Python — no frameworks, just the core loop and logic.AI Agents are everywhere right now. If you look at the landscape in 2026, it is dominated by powerful frameworks like LangGraph, CrewAI, and AutoGen.Here's the thing: many guides focus on conf...
7時間前

「渋⾕ Biz × AI: ビジネスにおける AI 利活⽤ 事例勉強会 第4回」レポート
Sansan Tech Blog
今回で4回目となった渋谷 Biz × AI 勉強会最近は家の近くにおいしいスパイスカレーのお店を見つけて良い気分です。研究開発部の吉村です。今回は、2026年2月16日にSansan株式会社で開催された、株式会社サイバーエージェント、株式会社ビズリーチ、Sansan株式会社の三社合同共催による「渋谷 Biz × AI: ビジネスにおける AI 利活用 事例勉強会 第4回」のレポートをお届けします。
7時間前

Walmart-Backed Flipkart Readies Mumbai IPO
PYMNTS.com
Flipkart, one of India’s biggest eCommerce platforms, is preparing for a potential initial public offering (IPO) in Mumbai that could take place this year or early next year, Bloomberg reported Wednesday (March 11), citing unnamed sources. The Walmart-backed firm could start the formal process of inviting banks to pitch for work on the IPO […]The post Walmart-Backed Flipkart Readies Mumbai IPO appeared first on PYMNTS.com.
8時間前

Windowsのターミナルからエクスプローラーをカレントディレクトリで開く
きしだのHatena
右クリックのメニューにエクスプローラーを開くメニュー欲しいよーと思ってたら「explorer .」で開けた、と書いてたらいろいろ情報が集まったのでまとめます。よいインターネッツだ。 コマンドプロンプト まずコマンドプロンプト。 explorer . explorerコマンドが使える。 そして、「start .」でもいける start . ちなみに今回紹介するコマンドはどれもファイルを指定すると紐づけられたアプリケーションで開く。次のようにhtmlを指定するとブラウザが開く explorer test.html PowerShell WindowsにはPowerShellもある explorer…
8時間前

Amazon Connect AIエージェントで、音声からの文字起こしが誤認識される場合の対策2選
DevelopersIO
Amazon Connect AIエージェントで、音声からの文字起こしが誤認識される場合の対策2選
8時間前

Amazon Quick の Quick Flows で Slack 通知を設定するときの Tips
DevelopersIO
Amazon Quick の Quick Flows で Slack 通知を設定するときの Tips
8時間前

Stitch Fix Clients Seek New Sizes as GLP-1 Use Climbs
PYMNTS.com
Stitch Fix used its fiscal second-quarter earnings call to highlight how artificial intelligence and data-driven personalization are reshaping the way consumers discover and purchase apparel on its platform. The company described a retail model powered by algorithms, data signals and stylist collaboration. Rather than relying on a single product launch, the company pointed to […]The post Stitch Fix Clients Seek New Sizes as GLP-1 Use Climbs appeared first on PYMNTS.com.
8時間前

フルリモートチームで感じた違和感を、システムコーチングでほどいていく
KAKEHASHI Tech Blog
はじめに こんにちは、Musubi機能開発チームの北川です。 フルリモートでチームを運営していると、大きな問題はなくコミュニケーションも回っている。 それでも、本当に踏み込んだ議論ができているのだろうか、と感じることはないでしょうか。 私自身、スプリントプランニングやレトロスペクティブを実施し、メンバーとの1on1も定期的に行っています。それでも、この問いに対してはっきりと「できている」と言い切ることができませんでした。 議論が発散して場に沈黙が生まれると、進行役として場が止まらないよう、つい無理に結論づけてしまったり、曖昧なまま次の話題に進めてしまうこともありました。 そんな違和感をEM(@…
8時間前

MCPの脆弱性まとめ:開発者が知っておくべきセキュリティリスク
Zennの「大規模言語モデル」のフィード
「MCPのSはSecurityの略」——Reddit の r/programming で話題になったジョークです。もちろん MCP に S は入っていません(Model Context Protocol)。つまり「MCPにセキュリティは存在しない」という皮肉ですね。このジョークが100以上の upvote を集めたのには理由があります。MCP は AI モデルが外部ツールやデータソースにアクセスするためのオープンプロトコルで、Claude Code や Cursor など多くのツールが対応しています。自分も日常的に使っていますが、便利な反面、「自然言語がアクションを決定する」という仕組...
8時間前

Karpathyのautoresearchを触ってみた — AIエージェントに一晩LLMの研究をさせる
Zennの「大規模言語モデル」のフィード
autoresearchとは2026年3月、Andrej Karpathyがautoresearchというリポジトリを公開しました。コンセプトは明快で、AIエージェントに小さなLLMの学習コードを渡し、自律的に実験を繰り返させる というものです。One day, frontier AI research used to be done by meat computers in between eating, sleeping, having other fun...仕組みはこんな感じです:GPTモデルの学習コード(train.py)が1ファイルにまとまっている学習は固...
8時間前

Perplexity Computer Uses Plaid Data to Personalize Financial Management
PYMNTS.com
Perplexity has added deeper capabilities for financial research to its cloud-based agent product, Perplexity Computer. The company added these capabilities to Perplexity Finance, the data and analysis layer underneath Computer, it said in a Wednesday (March 11) blog post. With these additions, Computer now has access to more than 40 live finance tools that pull data from authoritative […]The post Perplexity Computer Uses Plaid Data to Personalize Financial Management appeared first on PYMNTS.com
9時間前

Sorting algorithms Simon Willison's Weblog
<p><strong><a href="https://tools.simonwillison.net/sort-algorithms">Sorting algorithms</a></strong></p>Today in animated explanations built using Claude: I've always been a fan of animated demonstrations of sorting algorithms so I decided to spin some up on my phone using Claude Artifacts, then added Python's timsort algorithm, then a feature to run them all at once. Here's the <a href="https://claude.ai/share/2c09f6f7-57ed-47eb-af2e-fc39ddc4c39f">full...
9時間前

LLMに「あなたは天才です」と伝えたら自己評価が10/10になった — ペルソナと自己認識の実験
Zennの「大規模言語モデル」のフィード
TL;DR3つのLLM(Qwen3.5:9B、GPT-OSS:20B、Claude Sonnet 4.6)に5種類のペルソナを与え、自己評価と実力のギャップを120回のAPI呼び出しで検証した。主な発見:「万能の天才」ペルソナでClaude Sonnetの自己評価が 8.1→10.0/10 に跳ね上がった(実力は7.4)ペルソナを与えると自己評価は上がるが、実力はほぼ変わらないClaude Sonnetだけが全ペルソナでバグを正しく指摘(ローカルLLMは全滅)詩人ペルソナのClaudeが数学を「3の韻を刻む数は333」と詩的に正解した 実験の動機前回のQwen...
10時間前

PayPay Lowers IPO Price Amid Market Turbulence
PYMNTS.com
Japanese digital wallet provider PayPay announced late Wednesday (March 11) that it is pricing its U.S. initial public offering at $16 per share. The shares are expected to begin trading on Nasdaq on Thursday (March 12), under the symbol “PAYP,” the company said in a press release. Bloomberg had reported earlier Wednesday that PayPay planned to […]The post PayPay Lowers IPO Price Amid Market Turbulence appeared first on PYMNTS.com.
10時間前

Amazon Streamlines Direct Sales for Merchants
PYMNTS.com
Amazon is making it easier for merchants to participate in Shop Direct, its program that helps customers find and buy products that are not sold in its own store. The company now enables merchants to sync their catalog, pricing and inventory with Shop Direct by using the same product feeds they already provide to […]The post Amazon Streamlines Direct Sales for Merchants appeared first on PYMNTS.com.
10時間前

[アップデート] AWS Builder ID が Apple / GitHub / Amazon アカウントでサインインできるようになりました
DevelopersIO
[アップデート] AWS Builder ID が Apple / GitHub / Amazon アカウントでサインインできるようになりました
10時間前

Mastercard Moves to Normalize Crypto Inside Its Payments Ecosystem
PYMNTS.com
The blockchain technology underpinning cryptocurrency is increasingly becoming divorced from the volatility and speculation of crypto markets themselves. In turn, it’s finding a new role as financial infrastructure. The latest sign of that shift came from Mastercard Wednesday (March 11) with the announcement of a new Crypto Partner Program designed to bring together more […]The post Mastercard Moves to Normalize Crypto Inside Its Payments Ecosystem appeared first on PYMNTS.com.
11時間前

Gen Z Turns Mobile Apps and Credit Into Financial Discipline
PYMNTS.com
Popular commentary portrays Generation Z as financially reckless, a cohort supposedly driven by impulse purchases, social media trends and a casual approach to money. The data tells a different story. Evidence from both Federal Reserve research and PYMNTS Intelligence suggests that younger Americans are neither uniquely irresponsible nor fundamentally worse off than earlier generations. […]The post Gen Z Turns Mobile Apps and Credit Into Financial Discipline appeared first on PYMNTS.com.
11時間前

FDIC Moves to Exclude Stablecoins From Deposit Insurance
PYMNTS.com
The Federal Deposit Insurance Corporation (FDIC) plans to propose rules saying that stablecoins are not eligible for FDIC pass-through insurance, and that tokenized deposits are eligible for such insurance. FDIC Chairman Travis Hill said this on Wednesday (March 11) in a speech delivered at the American Bankers Association’s Washington Summit. With pass-through insurance, deposits […]The post FDIC Moves to Exclude Stablecoins From Deposit Insurance appeared first on PYMNTS.com.
11時間前

CADの新しい形? 3:さらに改良されたAIモデルでCADQUERYコード
Zennの「大規模言語モデル」のフィード
前回はCadCoderというCadQueryを画像から予測するモデルをためしました。残念ながら結果は微妙でした。https://zenn.dev/takeofuture/articles/4f389e47882e23このシリーズはここで打ち切ろうと思ってましたが、別の論文CADEvelveというものがあったのでそれも読む限り世下げであったので、試してみることにしました。残念ながらこのモデルは入力にSTLというふぁるで受け取ってそれをレンダーしたうえで、予測させるものです。論文: https://arxiv.org/abs/2602.16317コード: https://gith...
13時間前

What OpenClaw Reveals About the Next Phase of AI Agents
Radar
In November 2025, Austrian developer Peter Steinberger published a weekend project called Clawdbot. You could text it on Telegram or WhatsApp, and it would do things for you: manage your calendar, triage your email, run scripts, and even browse the web. By late January 2026, it had exploded. It gained 25,000 GitHub stars in a […]
15時間前

Google PlayのGoogleの取り分が20%以下に値下げへ。独自課金システムや外部Webサイトに誘導しての課金も可能に
Publickey
Googleは、Google Playにおける課金時のGoogleの取り分を従来の30%から20%に値下げすると同時に、アプリ独自の課金システムやGoogle Play外のWebサイトへ誘導しての課金も可能にすると発表しました。 また、サー...
16時間前

[アップデート] Amazon Bedrock AgentCore RuntimeがStateful MCPサーバーに対応しました
DevelopersIO
[アップデート] Amazon Bedrock AgentCore RuntimeがStateful MCPサーバーに対応しました
16時間前

JavaScript製表計算ライブラリ「SpreadJS」、生成AIへの指示で自動集計や分析が可能になる機能搭載
Publickey
Excelライクな表計算機能をWebアプリケーションなどに組み込めるJavaScript製ライブラリ「SpreadJS」を提供するメシウス(旧グレープシティ)は、同製品の新バージョン「SpreadJS v19J」で、生成AIとの連携機能を搭...
16時間前
3/11 (水)

gpt-oss-20bでRoo Codeを動かす
きしだのHatena
前回のQwen3.5でコーディングを試したときに、gpt-oss-20bをRoo Codeで使うときのやりかたで、これどうかなとブックマークコメントに書かれてたので試したら、Roo Code使えるようになりました。 Qwen3.5の中規模モデル(122B/35B/27B/9B)をコーディングエージェントで試してみる - きしだのHatena これです。 GPT-OSS 20B with Cline and Roo Code :: Alde's Blog 構文定義ファイルとして次のようなものを用意して、cline.gbnfとして保存します。 root ::= analysis? start fi…
17時間前

Quoting John Carmack Simon Willison's Weblog
<blockquote cite="https://twitter.com/ID_AA_Carmack/status/1405932642005041153"><p>It is hard for less experienced developers to appreciate how rarely architecting for future requirements / applications turns out net-positive.</p></blockquote><p class="cite">&mdash; <a href="https://twitter.com/ID_AA_Carmack/status/1405932642005041153">John Carmack</a>, a tweet in June 2021</p> <p>Tags: <a href="https://simonwillison.net/tags/john-car...
17時間前

Node.js Moves to Annual Major Releases Starting with Node 27
Socket
The project is retiring its odd/even release model in favor of a simpler annual cadence where every major version becomes LTS.
18時間前

Rakuten fixes issues twice as fast with Codex OpenAI News
Rakuten uses Codex, the coding agent from OpenAI, to ship software faster and safer, reducing MTTR 50%, automating CI/CD reviews, and delivering full-stack builds in weeks.
19時間前

液晶モニタ買い替え - 橋本商会 - Cosense
橋本商会 - Cosense
今使っているもの iiyama 31.5インチモニタ X3291HS-B1候補 LG 34インチ 湾曲 3440×1440 https://www.yodobashi.com/product/100000001008758125/ 6万円 JapanNext 31.5インチ 3840×2160 https://www.yodobashi.com/product/100000001008189244/ 4.4万円 JapanNext 31.5インチ 3840x2160 https://www.yodobashi.com/product/100000001008680260/ 5.4万円 USB-C接続で画面表示とMacへの給電ができる
20時間前

生成AIの成果物を定量評価する仕組みの検討メモ(Vertex AI)
Zennの「大規模言語モデル」のフィード
背景:プロンプト改善における「主観」の限界プロンプトを調整しても、改善したのかデグレ(品質低下)したのかが主観的な判断になりがち。100件単位でテストを行い、統計的に「今回のアップデートで精度が◯%向上した」と定量化できる仕組みが必要。「なんとなく良くなった」を排除し、信頼性の高いデプロイ判断基準を持ちたい。 Vertex AI Evaluation Service による評価の自動化AI(Autorater)が特定の指標に基づき、生成物を採点・比較するマネージドサービス。適応型ルーブリック: プロンプトの内容に応じて、AIがその場で適切な採点基準(ルーブリック)...
20時間前

Designing AI agents to resist prompt injection OpenAI News
How ChatGPT defends against prompt injection and social engineering by constraining risky actions and protecting sensitive data in agent workflows.
21時間前

Fast Paths and Slow Paths
Radar
Autonomous AI systems force architects into an uncomfortable question that cannot be avoided much longer: Does every decision need to be governed synchronously to be safe? At first glance, the answer appears obvious. If AI systems reason, retrieve information, and act autonomously, then surely every step should pass through a control plane to ensure correctness, […]
21時間前

Wayfair boosts catalog accuracy and support speed with OpenAI OpenAI News
Wayfair uses OpenAI models to improve ecommerce support and product catalog accuracy, automating ticket triage and enhancing millions of product attributes at scale.
21時間前

From model to agent: Equipping the Responses API with a computer environment OpenAI News
How OpenAI built an agent runtime using the Responses API, shell tool, and hosted containers to run secure, scalable agents with files, tools, and state.
21時間前

Deploy React แอปพลิเคชันด้วย AWS Amplify (Host Static-Website with AWS Amplify Part. 3)
DevelopersIO
AWS Amplify คือชุดเครื่องมือและบริการจาก Amazon Web Services ที่ช่วยให้นักพัฒนาสร้างและปรับขนาดแอปพลิเคชัน full-stack ได้อย่างรวดเร็วโดยเฉพาะแอปพลิเคชันบนมือถือและเว็บได้ บทความนี้ผมได้ทำการทดลองสำเร็จและอยากเอามาแชร์ให้เพื่อนๆ ได้อ่านกันและทำตามครับ
1日前

skill-creatorで作ったSkillを育てる4つの改善ポイント【公式ガイド日本語訳付き】
Zennの「大規模言語モデル」のフィード
はじめにClaude Code の skill-creator で Skill を作ったはいいものの、発火しない、指示通りに動かない、なんか違う——そういう状態がしばらく続いていました。Anthropic が公式ガイドを出しているのを見つけて読んでみたら、自分が見落としていたポイントがいくつかあって、そこを直したら動くようになりました。この記事はその記録です。末尾に原文ガイドの日本語訳全文も折りたたんで掲載しているので、深掘りしたい方はそちらも見てみてください。 1. 曖昧さを排除する指示の書き方で一番多い失敗がこれです。Validate the data befor...
1日前

CloudFront Functions で uri を書き換えてもオリジンへのリクエスト先が変わらないのはなぜですか
DevelopersIO
CloudFront Functions で uri を書き換えてもオリジンへのリクエスト先が変わらないのはなぜですか
1日前

AWS上でブラウザリダイレクトを実装するパターンを制約とともにまとめてみた
DevelopersIO
AWSでブラウザリダイレクトを行う場合の構成にはいくつかパターンがあります。これらのパターンのうちどれを選ぶかという基準を、制約ベースでまとめてみました。
1日前

なぜAnthropicは安全性を重視するのか
Zennの「大規模言語モデル」のフィード
Anthropicの思想 なぜ「安全なAI」を作ろうとしているのかAI企業は同じLLMを作っているように見える。しかし実際にはそれぞれ異なる思想を持っている。その中でもAnthropicは少し特殊な企業だ。Anthropicは、AIの安全性を研究の中心に置く企業だからである。 Anthropicとは何をしている会社なのかAnthropicは2021年に設立されたAI企業である。創業メンバーの多くは、OpenAI出身の研究者だった。彼らがAnthropicを作った理由は一つ。AI Alignmentの研究を進めるためである。 AI Alignment...
1日前

claude -p で動くAIエージェントチームに自己学習機能を実装した
Zennの「大規模言語モデル」のフィード
はじめに経営判断の質とスピードを高めるために、プロセス常駐の形でAIエージェントチームを運用しています。8チーム・32エージェントが macOS の launchd + cron で定期実行され、戦略分析・リスク監視・KPIトラッキングなどを日々自動で行っています。しばらく運用して気づいた問題がありました。同じミスを繰り返す — 「アクションプランが抽象的すぎる」と人間が指摘しても、翌日にはまた同じ粒度のレポートが出てくる品質が安定しない — ある日は優秀な分析を出すのに、別の日は見当違いな内容になる改善が属人的 — プロンプトを手動で書き換えないと品質が上がらない...
1日前

エンタープライズ向けAIチャットボット開発事例
Zennの「大規模言語モデル」のフィード
エンタープライズ向けAIチャットボット開発事例 大規模カスタマーサポートを自動化するAIアーキテクチャ近年、多くの企業が AIチャットボット を導入しています。しかし実際の開発現場では、単純なFAQボットでは対応できないケースが多く存在します。特にエンタープライズ環境では次のような課題があります。月数万〜数十万件の問い合わせCRM / ERPなどの企業システムとの連携日本語自然言語処理の精度セキュリティ要件人間オペレーターへのエスカレーションこの記事では、AIソリューション開発を行う NKKTech Globalのプロジェクト経験をベースに、エンタープライ...
1日前

Claude CodeのloopコマンドとClaude Desktopのスケジュール、CursorのAutomationsはどう違うのか
1
DevelopersIO
Claude CodeのloopコマンドとClaude Desktopのスケジュール、CursorのAutomationsはどう違うのか
1日前

Claude Codeのbtwコマンドを使ってみたらforkコマンドとの使い分けが見えてきた
DevelopersIO
Claude Codeのbtwコマンドを使ってみたらforkコマンドとの使い分けが見えてきた
1日前

Amazon MWAA ServerlessではAirflow Variableが使えないので移行方法を考える
DevelopersIO
Amazon MWAA ServerlessではAirflow Variableが使えないので移行方法を考える
1日前

[アップデート] Amazon Bedrockで、最初のトークンを受信するまでの時間と1分あたりのクォータ消費量をAmazon CloudWatchメトリクスとして取得できるようになりました
DevelopersIO
Amazon BedrockのAmazon CloudWatch(以下、CloudWatch)メトリクスとして、リクエストを送信してから最初のトークンを受信するまでの時間であるTimeToFirstTokenと、1分あたりのクォータ消費量であるEstimatedTPMQuotaUsageが、新しく追加されました。
1日前

【AI Code Review】PR Agentって簡単に作れるんやで。そう。Amazon Bedrockならね。
1
TooMeの記事 - Qiita
はじめにTooMeです。この度AWS Community Builder に認定されました。今年度はより一層気合を入れてAWS関連のキャッチアップおよびアウトプットをできればいいなと考えています。少し前にはじめたXはこちら今回は、Github.com上でPull ...
1日前

퍼블릭 서브넷인데 EC2 SSH 접속이 안 된다면? 확인해야 할 4가지
DevelopersIO
퍼블릭 서브넷에 위치한 EC2 인스턴스임에도 SSH 접속이 되지 않는 경우, 확인해 보면 좋은 4가지 항목에 대해 정리해 보겠습니다.
1日前

事業チームのコンテキスト情報をClaudeに蓄積・活用させるプラグインと、それを作るためのプラグインを作った
DevelopersIO
AIの業務活用で本当のボトルネックになるのは、モデルの性能ではなくコンテキストの不足です。案件情報やナレッジが散らばり、蓄積も続かない。この課題に対して、Claudeに情報の収集・構造化を任せて人間は確認・承認するだけのプラグインと、それをチームごとに生成できるジェネレーターを作りました。
1日前

[アップデート] Amazon Route 53 Global Resolver が GA されました!
1
DevelopersIO
[アップデート] Amazon Route 53 Global Resolver が GA されました!
1日前

本番LLM Gateway比較:LiteLLM・Portkey・Kong・Bifrost・Heliconeの選び方
Zennの「大規模言語モデル」のフィード
本番LLM Gateway比較:LiteLLM・Portkey・Kong・Bifrost・Heliconeの選び方 この記事でわかることEnterprise環境で使えるLLM Gatewayの5製品を多角的に比較できる各ツールのデプロイ方法(Docker / Kubernetes / マネージド)と運用コストを把握できるパフォーマンスベンチマーク(RPS・P95/P99レイテンシ)に基づく選定判断ができるコンプライアンス(SOC 2 / HIPAA / GDPR)要件に応じた選び方がわかる自社のトラフィック規模・チーム体制に合ったGatewayを選定できる 対象...
1日前

Pythonで作るClaudeエージェント実践入門
Zennの「大規模言語モデル」のフィード
本番AIエージェントの設計・実装・運用を体系的に学ぶ完全ガイド — notecreator実装で¥24,720/月を達成
1日前

Claude Codeのスキル機能でAWSアーキテクチャ図の自動生成を実現した話
1
DevelopersIO
Claude Codeのスキル機能を使い、Draw.ioのAWSアーキテクチャ図を自動生成する仕組みを構築。Draw.ioリポジトリからアイコンデータを機械的に抽出し、参照ファイルとして整備することで、正確なアイコン・カラー・レイアウトの構成図とコンパニオンガイドをセットで生成できるようにしました。
1日前

思想共有者を探しています
Zennの「大規模言語モデル」のフィード
思想共有者を探しています。これは、既存の生成型LLMを改良する提案ではありません。精度向上、hallucination削減、RAG補強、guardrail、moderation、alignmentの話とも別軸です。いまの生成型AIには、未確定な情報や、参照・推論・個人化・不確実性の区別が明示されないまま、断定的な出力としてユーザーのもとに届いてしまう構造的な問題があります。本構想はこれを、単なる「誤りの生成」の問題としてではなく、人間がAI出力に対して責任を取らなければならないにもかかわらず、そのための判断材料が欠けたまま出力が流通してしまう問題として捉えています。ただし、これ...
1日前

創発的なコミュニケーションが生まれる新感覚の一日!React Tokyo フェス 2026 イベントレポート
1LINEヤフー Tech Blog (LY Corporation Tech Blog
皆さんこんにちは。花谷(@potato4d)です。今回は2月28日に開催された React Tokyo フェス 2026 について、LINEヤフーとしてスポンサーを行いました。本記事では、イベント本編...
1日前

ダイアログ実装にみるトレンドと実装の中身
41
エムスリーテックブログ
皆さん、こんにちは! デジスマチームの小島(@jiko_21)です。 このブログはデジスマチームブログリレーの1日目の記事です。 フロントエンド開発において、モーダル(ダイアログ)の実装は非常にポピュラーなタスクの1つです。しかし、近年のUIライブラリを見ていると、その「実装スタイル」が大きく様変わりしていることに気づかされます。 今回は、ダイアログの実装トレンドと、Radix UIなどのモダンなライブラリが裏側でどのように動いているのか、その「中身」について掘り下げてみたいと思います。 ダイアログ実装のトレンドの変化 従来のスタイル 最新のスタイル なぜ渡していないonClickが動くのか …
1日前

QdrantでHybrid Searchを設計する|dense + sparse + RRFの実戦設計
Zennの「大規模言語モデル」のフィード
導入:Hybrid Searchをもう一度考えるRAGの検索精度を高める手段として、Hybrid Search(Dense + Sparse)はすでに広く知られています。私も以前の記事で、ハイブリッド検索の設計について検証を行いました。しかし、その際に使用したのはChromaDBであり、実務の本番運用DBとして採用するケースは多くありません。そこで次に検証したのが、PostgreSQL + pgvectorの構成です。PostgreSQLはFTS(Full Text Search)を持っているため、Dense検索(Vector Search)とSparse検索(BM25に近い...
1日前

EMConf JP2026 参加レポート(murata)
1
Timee Product Team Blog
こんにちは。タイミーでAndroid Chapter Leadをしているmurataです。 普段はAndroidコミュニティの運営やTech Lead的な動きをすることが多いのですが、今回はいつもの技術領域とは少し異なる視点を得たくて、今回のEngineering Management Conference Japan 2026(以下、EM Conf)に参加しました。 EM系のカンファレンスは初参加でしたが、新たな世界を見ることができた1日でした。 📝 注記 各セッションの「聞いたこと」は、私なりに理解し印象に残ったポイントの抜粋です。実際の講演内容と齟齬がある可能性があるためご了承ください。…
1日前

AgentBench SFTチューニングの実験記録 — LoRA rank・epochs・マージ手法の系統的検証
Zennの「大規模言語モデル」のフィード
TL;DRAgentBench(ALFWorld + DBBench)向けに 100以上のモデル をSFTで学習し、LoRA rank、エポック数、モデルマージ手法などを系統的に検証した。主な発見:LoRA rank: r=8/12/16/48はすべて有害。r=32のみ有効エポック数: 0.1刻みの違いが致命的。epochs=1.0がピンポイントの最適値eval_loss: タスク性能と相関しない。最低のeval_lossが最悪のタスク性能を出したモデルマージ: SLERP/DARE-TIESは「良いとこ取り」ではなく「トレードオフの再分配」データ増強: 3,...
1日前

社内におけるAI駆動開発の知見共有をテーマとしたLINEヤフー Development with Agents Meetup #1 東京を開催しました
1LINEヤフー Tech Blog (LY Corporation Tech Blog
2026年2月17日、当社主催の「LINEヤフー Development with Agents Meetup #1」を紀尾井町オフィスとオンラインの同時開催で実施しました。会場参加は定員100名で満...
1日前

複雑なLLMプロンプト設計に疲れた人へ — Self-Discoverで「思考ステップ」を自動設計する入門
Zennの「大規模言語モデル」のフィード
はじめにルミナイR&Dチームの栗原です。「Let’s think step by step を付けると精度が上がる」——Chain-of-Thought(CoT)以降、「どう考えさせるか」=プロンプト設計がずっと重要なテーマになっています。でも、よく考えると CoT ってかなり人間主導です。どんなステップで解くか(例:式を立てる → 代入 → 計算)は、人間が決めているモデルは、その“型”に乗って推論しているだけタスクが増えるたびに、人間が「この問題はこういうステップで考えるといいよ」と教え続けるのは、スケールしません。そこで登場するのが、Pei ...
1日前

Merakiダッシュボードを開かないネットワーク運用を目指してーMCPサーバー自作と活用事例
Sansan Tech Blog
Merakiの情報を確認したいときに、ダッシュボードへのログインを手間に感じていませんか? あるいは、作業手順書とMerakiのデバイス情報を行き来するのに手間を感じていませんか? 私たちはMeraki専用のMCP(Model Context Protocol)サーバーを開発し、日常の確認作業の多くをダッシュボードなしで完結させることを目指しました。 はじめに こんにちは、Sansan株式会社 コーポレートシステム部 末次です。コーポレートシステム部は、いわゆる情報システム部門にあたります。 部のミッションとして掲げているのが「EX(従業員体験)をシンプルにする」というものです。その中で私たち…
1日前

オントロジー×化学情報学×LLM。MetaWeaveが挑む「思考の構造」の高速検索アーキテクチャ
Zennの「大規模言語モデル」のフィード
はじめに:PLURAが目指す「熱源の連鎖」と、RAG(意味的検索)の限界私たちdx-junkyard が開発を進める分散型共創知能システム「PLURA」は、「小さな熱源が有機的につながり、変革が連鎖する社会」を目指しています。個人の日々の試行錯誤や、一見使い道のない「ジャンク(ガラクタ)」に見えるアイデアを無駄にせず、必要な瞬間に他者の文脈と結びつける(Just-in-Time Teaming)ための生態系です。この「知の結びつき」を根底で支えるナレッジベースの中核エンジンとして開発しているのが、今回紹介する構造探索プロジェクト 「MetaWeave(仮称)」 です。以下、本...
1日前

AI should help us produce better code Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Many developers worry that outsourcing their code to AI tools will result in a drop in quality, producing bad code that's churned out fast enough that decision makers are willing to overlook its flaws.</p><p>If adopting coding agents demonstrably reduces the quality of the code and features you are producing, ...
1日前

5 Malicious Rust Crates Posed as Time Utilities to Exfiltrate .env Files
Socket
Published late February to early March 2026, these crates impersonate timeapi.io and POST .env secrets to a threat actor-controlled lookalike domain.
1日前

マイクロソフトが「.NET Skills」公開。AIエージェントの.NET開発能力を拡張
Publickey
マイクロソフトは、AIエージェントの能力を拡張する「Agent Skills」の仕組みに対応した、.NETの開発スキルを向上させる「.NET Skills」を公開しました。 Agent Skillsは、Anthropicが提唱したAIエージ...
2日前

Claude Codeに高度なコードレビュー機能が登場。深いコードレビューに最適化し、人間が見逃しがちなバグまで検出
Publickey
Anthropicは、同社のAIコーディングエージェントであるClaude Codeに高度なコードレビュー機能をリサーチプレビューとして搭載したことを明らかにしました。 AIエージェントにより多数のコードが短時間に生成できるようになってくる...
2日前
3/10 (火)

New Kinds of Applications
Radar
I’ve said in the past that AI will enable new kinds of applications—but I’ve never had the imagination to guess what those new applications would be. I don’t want a smart refrigerator, especially if it’s going to inflict ads on me. Or a smart TV. Or a smart doorbell. Most of these applications are silly, […]
2日前

Improving instruction hierarchy in frontier LLMs OpenAI News
IH-Challenge trains models to prioritize trusted instructions, improving instruction hierarchy, safety steerability, and resistance to prompt injection attacks.
2日前

New ways to learn math and science in ChatGPT OpenAI News
ChatGPT introduces interactive visual explanations for math and science, helping students explore formulas, variables, and concepts in real time.
2日前

第58回情報科学若手の会 参加レポート:社内のネットワークでの取り組みについて発表しました LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは、ソフトウェアエンジニアの多根(@SEED0228777)です。普段は、検索領域で地域情報検索システムのためのプラットフォームを開発・運用しております。2025年10月11日から13日の3日...
2日前

OpenClaw Advisory Surge Highlights Gaps Between GHSA and CVE Tracking
Socket
A recent burst of security disclosures in the OpenClaw project is drawing attention to how vulnerability information flows across advisory and CVE systems.
2日前

デザインの現在地
KAKEHASHI Tech Blog
はじめに こんにちは、カケハシの生成AI研究開発チームとMusubi Insightチームにてデザイナーをしている堤です。 最近、X界隈では「Figma不要論」といった過激な言葉も飛び交うなど、UIデザインのプロセスが大きな転換期を迎えています。2026年3月現在、私自身のワークフローを振り返ってみても、ほぼ全てのプロトタイピングをコードで行うようになっています。正直なところ、新しいコンポーネントの細かな調整以外でFigmaを開く時間は、以前に比べて劇的に減りました。 この記事は、デザインプロセスの変化について社内のLT会で共有した資料を交えつつ、いちデザイナーとして感じている現場感をまとめた…
2日前

最新のPyTorchで軽量OCRモデルPARSeqをTensorRT化する
NTT docomo Business Engineers' Blog
こんにちは。イノベーションセンターの加藤です。普段はコンピュータビジョンの技術開発やAIシステムの検証に取り組んでいます。今回は最新版のPyTorchを使って軽量なTransformerベースOCRモデルであるPARSeq(Permuted Autoregressive Sequence)をTensorRTモデルに変換して高速化した取り組みについて紹介します。
2日前
Claude CoworkがMicrosoft 365 Copilotに採用。「Copilot Cowork」としてリサーチプレビュー公開
Publickey
マイクロソフトは、同社のオフィススイートのAI機能である「Microsoft 365 Copilot」を拡張し、AnthropicのClaude Coworkを採用した「Copilot Cowork」を発表しました。 そもそもAnthrop...
3日前

Node.js、今後は年に一度のリリースとなり、すべてのリリースがLTS版になると発表
25
Publickey
Node.jsのリリースチームは、これまで6カ月ごとに年に2回行われていたNode.jsのリリースを年に1回とし、すべてのリリースがLTS版になることを発表しました。 毎年4月にリリースされ、安定化期間を経てLTSに移行 現在までNode....
3日前

専用OS「Windows CPC」を搭載した「クラウドPC」デバイスがDellとASUSから登場
61
Publickey
マイクロソフトは、デスクトップ仮想化の技術を用いてWindows環境をクラウドから配信する「Windows 365 クラウドPC」専用のクライアントデバイスがDellとASUSから登場することを発表しました。 Announcing new ...
3日前

Production query plans without production data Simon Willison's Weblog
<p><strong><a href="https://boringsql.com/posts/portable-stats/">Production query plans without production data</a></strong></p>Radim Marek describes the new <a href="https://www.postgresql.org/docs/current/functions-admin.html#FUNCTIONS-ADMIN-STATSMOD"><code>pg_restore_relation_stats()</code> and <code>pg_restore_attribute_stats()</code> functions</a> that were introduced <a href="https://www.postgresql.org/docs/current...
3日前
3/9 (月)

Perhaps not Boring Technology after all Simon Willison's Weblog
<p>A recurring concern I've seen regarding LLMs for programming is that they will push our technology choices towards the tools that are best represented in their training data, making it harder for new, better tools to break through the noise.</p><p>This was certainly the case a couple of years ago, when asking models for help with Python or JavaScript appeared to give much better results than questions about less widely used languages.</p><p>With <a href="http...
3日前

Soft Forks: How Agent Skills Create Specialized AI Without Training
Radar
Our previous article framed the Model Context Protocol (MCP) as the toolbox that provides AI agents tools and Agent Skills as materials that teach AI agents how to complete tasks. This is different from pre- or posttraining, which determine a model’s general behavior and expertise. Agent Skills do not “train” agents. They soft-fork agent behavior […]
3日前

OpenAI to acquire Promptfoo OpenAI News
OpenAI is acquiring Promptfoo, an AI security platform that helps enterprises identify and remediate vulnerabilities in AI systems during development.
3日前

理想のプラットフォームを目指す、kintoneプラットフォームエンジニアリング部の仲間たち
Cybozu Inside Out | サイボウズエンジニアのブログ
kintoneの開発部門には、「プラットフォームエンジニアリング部(以下、PfE部)」があります。aki (@aki366) が、PfE部が何をする部なのか、なぜ今このタイミングで立ち上がったのかを、立ち上げメンバーへのインタビューを通してひも解く3部作。今回はその最終回です。第1回:なぜ、kintoneにプラットフォームエンジニアリング部は生まれたのか第2回:探索型開発と向き合う、kintoneプラットフォームエンジニアリングの挑戦人と文化の両面から、PfE部の今とこれからを探るプラットフォームは機能や基盤の進化だけでなく、そこに関わる人たちの考え方や文化も重要です。こんにちは。プラットフォームエンジニアリング部所属の aki (@aki366) です。前回に引き続き 上岡 (@ueokande) さんと 三苫 (@mitomasan) さんにお話を伺っていきたいと思います。この記事の構成は以下の通りです。人と文化の両面から、PfE部の今とこれからを探るPfE部の今Q. 今のPfE部には、どんなメンバーが集まっていますか?Q. このチームらしさはどこに現れますか?PfE部のこれからQ
3日前

LINEアプリにおける複数人トークとグループトークの統合 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2022年2月24日)を、現在のブログへ移管したものです。内容は初出時点のものです。LINEアプリは1対1の会話だけでなく、複数ユーザーでの会話に...
3日前

直感的な検索を目指して(『ベクトル検索実践入門』を執筆しました) LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。LINEヤフー株式会社で検索エンジン開発のマネジメントを行っている真鍋です。検索のなかでも、今回はベクトル検索についてお話しします。ベクトル検索は、LINEヤフーでも検索や広告配信、レコメ...
3日前

App-based ライフサイクルからScene-based ライフサイクルへの移行対応で見つけた既存バグと学び
Sansan Tech Blog
はじめに 技術本部 Sansan Engineering Unit Mobile Application GroupでiOSエンジニアとして開発に携わっている新卒1年目の松山( @akidon0000 )です。 今回は、iOS 27で必須対応となる「App-based ライフサイクルからScene-based ライフサイクルへの移行」の対応を終えたので、その内容についてご紹介します。 iOS 27からのScene-based ライフサイクル必須化 2025年6月に開催されたWWDC25で、Appleから重要な発表がありました。 "As scenes are vital for ensuring…
3日前

RDS/Aurora PostgreSQL のメジャーバージョンアップグレードを Blue/Green Deployment で行うメリットと注意点
Wantedly Engineer Blog
先日、RDS/Aurora PostgreSQL のメジャーバージョンアップグレードを実施しました。今回のアップグ...
3日前

LLMが生成したテストの品質をMutation Testingで検証する
KAKEHASHI Tech Blog
ランキング参加中プログラミング はじめに 「このファイルのテストを書いて」とLLMに依頼すれば、それらしいテストコードが秒で生成される時代になりました。しかし、生成されたテストが本当に役に立つかどうかは別問題です。 コードカバレッジが100%でも、アサーションが甘いかもしれない 重要な分岐をテストしていないかもしれない 人間がレビューしても、網羅性の判断は難しい 本記事では、Mutation Testingを使ってLLM生成テストの品質を定量的に評価し、改善するワークフローを紹介します。 Mutation Testingとは コードを意図的に壊し(ミュータント)、テストがその変更を検出できるか…
3日前

AWS、AWS上ですぐ使えるOpenClawを提供開始。仮想プライベートサーバ(VPS)「Amazon Lightsail」のインスタンスイメージとして
Publickey
Amazon Web Services(AWS)は、仮想プライベートサーバ(VPS)のAmazon Lightsailで簡単にOpenClawが導入できる、事前設定されたOpenClawインスタンスイメージの提供を開始しました。 Amazo...
4日前

OpenAI、「Codex for Windows」正式リリース。Windowsサンドボックス内で安全にAIエージェントを実行、WSLにも対応
Publickey
OpenAIは、Windows対応のAIエージェントによる開発環境「Codex for Windows」の正式リリースを発表しました。 Codex for Windowsは、AIエージェントを用いてプログラミングやテストを行うための開発環境...
4日前

Claude Codeが「音声モード」搭載。AIに話しかけながらのコーディングが可能に
Publickey
Anthropicが提供するAIコーディングツールであるClaude Codeに、新たに「音声モード」が搭載されることが明らかになりました。 AnthropicでClaude Codeを担当するエンジニアThariq Shihipar氏が次...
4日前
3/8 (日)

Quoting Joseph Weizenbaum Simon Willison's Weblog
<blockquote cite="https://archive.org/details/computerpowerhum0000weiz_v0i3?q=realized"><p>What I had not realized is that extremely short exposures to a relatively simple computer program could induce powerful delusional thinking in quite normal people.</p></blockquote><p class="cite">&mdash; <a href="https://archive.org/details/computerpowerhum0000weiz_v0i3?q=realized">Joseph Weizenbaum</a>, creator of ELIZA, in 1976 (<a href="https://www.tikto...
4日前

Qwen3.5の中規模モデル(122B/35B/27B/9B)をコーディングエージェントで試してみる
きしだのHatena
Qwen3.5の中規模モデル(122B/35B/27B/9B)をコーディングエージェントで試してみます。 結論としては、122Bは使える、27Bはなんとか、35Bはストレスに耐えながら、9Bは全然むり、という感じ。 27Bは修正で関係ないところを壊す、35Bは修正として関係ない作業をする、9Bはコンパイル通るコードを書けなかった。 Qwen3.5シリーズの全体的に、395Bまで含め、難しいコードや問題特定は不得意だけど、サイズ相応にそこそこコーディングにも使える、というところ。 ただ、どのモデルもOpenCodeで問題なく動いていて、エージェント対応は完璧です。 コーディング以外だとどのモデル…
4日前

Codex for Open Source Simon Willison's Weblog
<p><strong><a href="https://developers.openai.com/codex/community/codex-for-oss">Codex for Open Source</a></strong></p>Anthropic announced six months of free Claude Max for maintainers of popular open source projects (5,000+ stars or 1M+ NPM downloads) <a href="https://simonwillison.net/2026/Feb/27/claude-max-oss-six-months/">on 27th February</a>.</p><p>Now OpenAI have launched their comparable offer: six months of ChatGPT Pro (same $2...
5日前
3/7 (土)

Quoting Ally Piechowski Simon Willison's Weblog
<blockquote cite="https://piechowski.io/post/how-i-audit-a-legacy-rails-codebase/"><p><strong>Questions for developers:</strong></p><ul><li>“What’s the one area you’re afraid to touch?”</li><li>“When’s the last time you deployed on a Friday?”</li><li>“What broke in production in the last 90 days that wasn’t caught by tests?”</li></ul><p><strong>Questions for the CTO/EM:</strong></p><ul>&l...
5日前

WAXAL: A large-scale open resource for African language speech technology
The latest research from Google
Natural Language Processing
6日前

Where wild things roam: Identifying wildlife with SpeciesNet
The latest research from Google
Climate & Sustainability
6日前

Anthropic and the Pentagon Simon Willison's Weblog
<p><strong><a href="https://www.schneier.com/blog/archives/2026/03/anthropic-and-the-pentagon.html">Anthropic and the Pentagon</a></strong></p>This piece by Bruce Schneier and Nathan E. Sanders is the most thoughtful and grounded coverage I've seen of the recent and ongoing Pentagon/OpenAI/Anthropic contract situation.</p><blockquote><p>AI models are increasingly commodified. The top-tier offerings have about the same performance, and there ...
6日前
3/6 (金)

Codex Security: now in research preview OpenAI News
Codex Security is an AI application security agent that analyzes project context to detect, validate, and patch complex vulnerabilities with higher confidence and less noise.
6日前

How Descript enables multilingual video dubbing at scale OpenAI News
Descript uses OpenAI models to scale multilingual video dubbing, optimizing translations for both meaning and timing so dubbed speech sounds natural across languages.
6日前

How Balyasny Asset Management built an AI research engine for investing OpenAI News
See how Balyasny built an AI research system with GPT-5.4, rigorous model evaluation, and agent workflows to transform investment analysis at scale.
6日前

Agentic manual testing Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>The defining characteristic of a coding agent is that it can <em>execute the code</em> that it writes. This is what makes coding agents so much more useful than LLMs that simply spit out code without any way to verify it.</p><p>Never assume that code generated by an LLM works until that code has be...
6日前

3日間のUnicorn Gymが1ヶ月で組織を変えた —— データで見るAI-DLC導入の波及効果
Timee Product Team Blog
こんにちは。タイミーでPlatform Engineeringグループのマネージャーを務める橋本(@kaz-under-the-bridge)です。 2026年1月26日〜28日の3日間、AWS様と共同で AI-DLC Unicorn Gym(以下UG)を開催しました。私はタイミー側のカウンターパートとして、企画・準備から当日の運営、振り返りまでを担当しました。 AI-DLC(AI-Driven Development Life Cycle)は、要件定義からリリースまでの開発プロセス全体にAIを深く組み込むことで、従来のアジャイル開発を大幅に加速するアプローチです。Unicorn Gymは、A…
6日前

Clinejection — Compromising Cline's Production Releases just by Prompting an Issue Triager Simon Willison's Weblog
<p><strong><a href="https://adnanthekhan.com/posts/clinejection/">Clinejection — Compromising Cline&#x27;s Production Releases just by Prompting an Issue Triager</a></strong></p>Adnan Khan describes a devious attack chain against the Cline GitHub repository, which started with a prompt injection attack in the title of an issue opened against the repo.</p><p>Cline were running AI-powered issue triage using the <code>anthropics/claude-code...
6日前

Vol.10 立ち上げからリリースまで、「シュッと話す」文化で走り抜けたSDI開発チームの話
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーのVol.10です。こんにちは、技術本部 Data Intelligence Engineering Unitのエンジニアの遠藤です。これまでのブログリレーでは、技術選定やアーキテクチャなど、システムの設計や技術的な側面を中心にお伝えしてきました。今回は少し視点を変えて、技術ではなく「チーム」にフォーカスし、Sansan Data Intelligence(以下、SDI)の開発チームがどのように立ち上がり、約6カ月でリリースまで走り抜けたのかをお話しします。
6日前

Introducing GPT‑5.4 Simon Willison's Weblog
<p><strong><a href="https://openai.com/index/introducing-gpt-5-4/">Introducing GPT‑5.4</a></strong></p>Two new API models: <a href="https://developers.openai.com/api/docs/models/gpt-5.4">gpt-5.4</a> and <a href="https://developers.openai.com/api/docs/models/gpt-5.4-pro">gpt-5.4-pro</a>, also available in ChatGPT and Codex CLI. August 31st 2025 knowledge cutoff, 1 million token context window. Priced <a href="https://www.llm-prices.c...
6日前

Fake imToken Chrome Extension Steals Seed Phrases via Phishing Redirects
Socket
Mixed-script homoglyphs and a lookalike domain mimic imToken’s import flow to capture mnemonics and private keys.
6日前

Socket Named a Supply Chain Innovator in Latio's 2026 Application Security Market Report
Socket
Latio’s 2026 report recognizes Socket as a Supply Chain Innovator and highlights our work in 0-day malware detection, SCA, and auto-patching.
7日前

Can coding agents relicense open source through a “clean room” implementation of code? Simon Willison's Weblog
<p>Over the past few months it's become clear that coding agents are extraordinarily good at building a weird version of a "clean room" implementation of code.</p><p>The most famous version of this pattern is when Compaq created a clean-room clone of the IBM BIOS back <a href="https://en.wikipedia.org/wiki/Compaq#Introduction_of_Compaq_Portable">in 1982</a>. They had one team of engineers reverse engineer the BIOS to create a specification, then handed that specifi...
7日前

Google Workspaceをコマンドラインで操作する「gws」、Googleがオープンソースで公開。Agent Skillsファイルも提供し、AIエージェントによる適切な操作実現
Publickey
Googleは、GmailやGoogle Drive、Sheets、Docs、Calendarなどを始めとするGoogle Workspace製品に対してコマンドラインからの操作を可能にする「gws」をオープンソースで公開しました。 gws...
7日前

State of JavaScript 2025公開/コーディングエージェントを安全にする分離環境/AI時代の開発プラットフォーム「Entire CLI」公開ほか。2026年2月の人気記事
Publickey
ちょっと汚い話で恐縮ですが、先日、人生で初めて膀胱炎を経験しました。 夜中に何度も尿意を感じるし、ひりひりするのに尿はほとんど出ないという症状。経験したことのない症状に当たると、これはどうなってしまうんだろう? と不安になりますよね。 翌日...
7日前
3/5 (木)

The Accidental Orchestrator
Radar
This is the first article in a series on agentic engineering and AI-driven development. Look for the next article on March 19 on O’Reilly Radar. There’s been a lot of hype about AI and software development, and it comes in two flavors. One says, “We’re all doomed, that tools like Claude Code will make software […]
7日前

Reasoning models struggle to control their chains of thought, and that’s good OpenAI News
OpenAI introduces CoT-Control and finds reasoning models struggle to control their chains of thought, reinforcing monitorability as an AI safety safeguard.
7日前

Introducing GPT-5.4 OpenAI News
Introducing GPT-5.4, OpenAI’s most most capable and efficient frontier model for professional work, with state-of-the-art coding, computer use, tool search, and 1M-token context.
7日前

Two-Tower モデルを利用した、まだ見たことがない魅力的な募集の推薦
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでデータサイエンティストをしている林 (@python_walker) です。会社訪問...
7日前

Ensuring AI use in education leads to opportunity OpenAI News
OpenAI shares new tools, certifications, and measurement resources to help schools and universities close AI capability gaps and expand opportunity.
7日前









