テックブログRSS

Obin AI Raises $7 Million for Agentic Tools for Financial Firms

Visa has launched Visa Intelligent Authorisation (VIA) in Europe, less than two weeks after introducing this new capability on the Visa Acceptance Platform. VIA enables modern payment processing through a single application programming interface (API) so that acquirers with legacy payment authorization systems don’t have to undertake costly infrastructure rebuilds, the company said in […]The post Visa Scales Intelligent Authorization Tech to Europe appeared first on PYMNTS.com.

25分前

Claude Code の /batch コマンドで同じ作業を6並列で回してみた

Obin AI has raised $7 million to develop agentic AI tools for financial institutions. “Founded by AI pioneers with deep roots in both Silicon Valley and global finance, Obin AI emerges from stealth with a clear objective to make AI trustworthy at the highest levels of financial decision-making,” the company said in a news release Thursday (March […]The post Obin AI Raises $7 Million for Agentic Tools for Financial Firms appeared first on PYMNTS.com.

1時間前

Amazon Chooses UK for Alexa+ European Debut

Claude Code /batch コマンドの使い方を実例で解説。Vitest テスト生成の並列実行、rules/skills でのルール適用、実案件で学んだ注意点をまとめました。

1時間前

Apple Enjoys Sales Boost in China Amid Market Downturn

Amazon has brought Alexa+ to the U.K., the first European country to receive the AI voice assistant. Alexa+ is now available across Great Britain as part of an early access program, with hundreds of thousands of customers expected to get invitations in the weeks ahead, Amazon announced Thursday (March 19). According to Amazon’s announcement, Alexa is […]The post Amazon Chooses UK for Alexa+ European Debut appeared first on PYMNTS.com.

1時間前

Keep Deterministic Work Deterministic

The Chinese smartphone market is rough these days for companies not named “Apple.” The iPhone maker’s sales in China — the world’s largest smartphone market — jumped 23% in the first nine weeks of this year amid a 4% market downturn, according to data released Thursday (March 19) by Counterpoint Research. “Although government subsidies were introduced at […]The post Apple Enjoys Sales Boost in China Amid Market Downturn appeared first on PYMNTS.com.

3時間前

PicPay Revenues Jump 85% as Financial Services Portfolio Expands

This is the second article in a series on agentic engineering and AI-driven development. Read part one here, and look for the next article on April 2 on O’Reilly Radar. The first 90 percent of the code accounts for the first 90 percent of the development time. The remaining 10 percent of the code accounts […]

4時間前

HSBC Weighs 10% Staffing Cut as Banks Hand Off Work to AI

PicPay, the Brazilian digital payments firm, is increasingly leaning on artificial intelligence to manage its rapid scale. The Brazilian digital payment firm discussed this effort Wednesday (March 18) as it reported its first quarterly earnings since going public earlier this year. Those results showed a 85% increase in net revenues for the year, a […]The post PicPay Revenues Jump 85% as Financial Services Portfolio Expands appeared first on PYMNTS.com.

4時間前

cdk acknowledge でAWS CDKの通知メッセージを抑制する

HSBC is reportedly considering widespread job cuts as the banking giant relies more on AI. The layoffs are expected to mostly focus on non-client facing jobs in the bank’s service centers, though the plans are still being worked out, Bloomberg News reported Thursday (March 19), citing sources familiar with the matter. The cuts could […]The post HSBC Weighs 10% Staffing Cut as Banks Hand Off Work to AI appeared first on PYMNTS.com.

4時間前

VSCodeの言語別の設定が特定のMarkdownファイルだけ反映されないときの解決策

cdk acknowledge でAWS CDKの通知メッセージを抑制する

5時間前

AWS Client VPN（相互認証）のハンズオンを試してみた

VSCodeの言語別の設定が特定のMarkdownファイルだけ反映されないときの解決策

5時間前

GitHub Agentic Workflowsでドキュメントの自動更新をやってみる

AWS Client VPN（相互認証）のハンズオンを試してみた

6時間前

金融営業から内製開発エンジニアへ ― 小さな行動で築いたキャリアの自律

GitHub Agentic Workflowsでドキュメントの自動更新をやってみる

6時間前

NTT docomo Business Engineers' Blog

はじめにビジネスdアプリ開発チームの徳原です。私は地元の金融機関で12年間営業職として勤務した後、IT業界へキャリア転換しました。本記事では、これまで私が転職で経験したことやキャリアの自律に向けた取り組みについて紹介します。目次はじめにこれまでのキャリア金融機関からIT業界へ前職(外資コンサル)でのSE業務キャリアを動かしたきっかけ継続的な学習前職のインフラ運用業務で苦戦したこと前職のアプリ開発で苦戦したこと現職へ転職することになったきっかけ現職の業務とキャリアの広がり学習の支援外部発表の機会現職のアプリ開発についてこれまでの経験から感じたキャリアの自律お…

7時間前

What Happens After ‘Instant’ Payouts? New Data Points to a Shift

Fraudsters Build Synthetic Identities That Fool Traditional KYC Checks

“Five Years of Change: How Payouts Shifted From Slow and Paper-Based to Instant and Digital,” a collaboration between PYMNTS Intelligence and Ingo Payments, tracks how the U.S. payout market changed throughout the last five years as consumers and businesses moved away from paper checks and slower bank transfers toward faster digital options. The central finding […]The post What Happens After ‘Instant’ Payouts? New Data Points to a Shift appeared first on PYMNTS.com.

7時間前

Banks Need Fewer Identity Silos and Faster Decisions

In the early days of digital banking, identity fraud largely meant stolen credentials: a breached password, a compromised Social Security number or a copied credit card. But digital banking is no longer early innings, and the growing category of identity fraud firms are facing is fundamentally different. Instead of stealing identities, criminals are manufacturing […]The post Fraudsters Build Synthetic Identities That Fool Traditional KYC Checks appeared first on PYMNTS.com.

7時間前

The Future of Credit Is Clashing With Its Past

Watch more: What’s Next in Payments With i2c’s Matthew Pearce Fraud is no longer limited to stolen credentials or isolated account takeovers. It’s now shaped and aided by systems that can replicate human behavior, forcing financial institutions to reconsider how identity is established and trusted across digital channels. In a recent “What’s Next in […]The post Banks Need Fewer Identity Silos and Faster Decisions appeared first on PYMNTS.com.

7時間前

独自LLMを作るには事業会社なら10兆円企業が必要？

Consumer credit has so far been shaped and defined by a single product. The revolving credit card. But the revolving credit card’s fundamental architecture, built for a world where credit lines were static and repayment schedules predictable, is now colliding with a new consumer reality. Findings in the March 2026 edition of the Payments […]The post The Future of Credit Is Clashing With Its Past appeared first on PYMNTS.com.

7時間前

gemini embedding 2 による資料の類似性は見た目で決まる？内容で決まる？ PDF と画像で検証してみた

楽天がRakutenAI-3.0を出しましたが、DeepSeek V3アーキテクチャモデルの追加学習モデルのようで、ちょっとそこが話題になってましたね。見せ方の問題もあって、フルスクラッチではないのかと。 https://huggingface.co/Rakuten/RakutenAI-3.0 一応、非公開ではあるけどベースモデルがあることは否定してない模様。楽天の最新AI、ベースは“中国DeepSeek製”？担当者に聞いた（1/2 ページ） - ITmedia AI＋で、気になったので、フルスクラッチで独自LLMを作れる企業の規模はどんなものか調べてみました。日本でフルスクラッチで作…

8時間前

Claude CodeのCLI+VS Code環境をGitHub Codespaces x Amazon Bedrockでシュッと構築してみた

前回、gemini-embedding-2 を使って、OCR しづらい資料でもそれっぽく近いものを拾えそう、という話を書きました。gemini embedding 2 で "資料単位のナレッジ化" が容易に！？OCRできない見た目の知識をRAG化するhttps://zenn.dev/bekku/articles/5fcbeae4ec5afb今回はその続きとして、もう少し気になっていたことを試しました。それが、PDF や画像のような資料において、embedding は見た目に強く引っ張られるのか、それとも資料中のテキスト内容に強く引っ張られるのか、という点です。加えて、gemin...

8時間前

生成AIでメンバー育成を『見える化』してみた -- コンテキストエンジニアリングとしてのデータ前処理とエージェント活用

Claude CodeのCLI+VS Code環境をGitHub Codespaces x Amazon Bedrockでシュッと構築してみた

8時間前

TerraformでAmazon S3のアカウントリージョナル名前空間バケットを作成してみた

フルリモート環境での育成は、メンバーの状況が見えにくい課題があります。散在するデータを Bedrock で収集・構造化し、業務固有のコンテキストを添えて分析することで、育成状況の見える化に取り組んだ話です。

8時間前

Google Home運用テクニック - 橋本商会 - Cosense

TerraformでAmazon S3のアカウントリージョナル名前空間バケットを作成してみた

9時間前

仮想待合室 SaaS "NetFUNNEL" に入門してみた～CloudFront連携がとても簡単だった件～

Google Homeを運用する上でのテクニックをまとめますshokai.iconok google 今何時 1回前のコマンドを再実行するコマンド「では、繰り返します。明日の◯◯の天気は雨です」 2023年ぐらいからずっとバグっている前のコマンドから長い時間が経過している場合だけ、時刻を教えてくれるok google もういいよ昔は再生中のニュースや音楽、目覚ましを解除するコマンドだったが 2024年ごろから「こっちのけんとのもういいよを再生します」に変化した代わりに「ok google もうやめて」を使うようになったshokai.iconok googleアラームを解除してok googleタイマーを解除して目覚ましを解除できたり、できなかったりするコマンド

9時間前

Okta連携でSnowflake Intelligence（AIチャット）だけをユーザーに開放してみた

仮想待合室 SaaS "NetFUNNEL" に入門してみた～CloudFront連携がとても簡単だった件～

9時間前

NVIDIA NemoClaw を Windows PC に導入してみた

Okta連携でSnowflake Intelligence（AIチャット）だけをユーザーに開放してみた

9時間前

ブレインパッドOBがプロスポーツチームのデジタルマーケターへ転身！「データ×熱狂」で地域に「応援する文化」を創り出すデジマ最前線

NVIDIA NemoClaw を Windows PC に導入してみた

10時間前

Platinum Data Blog by BrainPad ブレインパッド

ブレインパッドが2024年8月に設立したアルムナイネットワーク「ブレインパッドアルムナイ・グラフ（以下：BAG）」。BAGは、ブレインパッドを退職した社員（以下、卒業生）と在籍中の社員の交流を生む施策を中心に、卒業生同士のつながりの醸成や、社員がキャリアを考える機会を提供することなどを目的に活動しています。● 2024年8月28日株式会社ブレインパッド発表ブレインパッド、アルムナイネットワーク「BAG」を設立、第1回交流イベントを開催－人材輩出企業として卒業生を応援、退職後もともにデータ活用の普及を促進－今回より、「“BrainPad Career Junction”～ブレインパッド卒業生とともに広げる、データ／AI活用の輪～」と銘打ち、ブレインパッドの卒業生が今どのような活躍をしているのか、どのようにデータ活用の輪を社会に広げているのかをお伝えしていきます。第1弾として、2023年にブレインパッドを卒業し、現在はプロスポーツチームにてデジタルマーケティングを担当されている中島さんからお話を伺いました。熱狂を生むデジマの最前線！プロスポーツチームで挑む挑戦の日々データサイエンテ

10時間前

DGX SparkのローカルLLMでClaude Codeを動かしてみた

作って、捨てて、また作る - Claude Code に社内ツールの開発を丸ごと任せた49日間の記録

DGX Sparkが手元にあるなら、ローカルLLMでClaude Codeを動かせないだろうか？そう思って試してみたら、意外とちゃんと動いた。ファイルの読み書き、コマンド実行、コード探索といった基本的なコーディング作業が、Anthropic APIなしでローカル完結でできるようになり、Webアプリを約1時間で自律的に構築するところまで到達した。この記事では、そのために作った「Claude Local Proxy」の仕組みと、小型モデルをClaude Codeで実用するために必要だった工夫をまとめておく。ソースコードはGitHubで公開している。https://github.com...

11時間前

【3/26 名古屋開催】なごやクラメソゆる勉強会 #1 — LT大会を開催します！

Claude Code に社内ツールの開発を丸ごと任せた49日間の記録です。アーキテクチャを途中で変え、10日間で111タスクを実装し、2,755件のテストが通ったものの、採用したプラットフォームの構造的な速度制限により本番採用を見送りました。高速に作って、高速に失敗して、次に活かす。AI 駆動開発で「撤退判断」まで行った体験記です。（読み終わるまでの時間：20分程度）

11時間前

生成AIはなぜ最近ちょっと慎重なのか？— Softmaxの話だけでは見えない商用AIの多層構造

【3/26 名古屋開催】なごやクラメソゆる勉強会 #1 — LT大会を開催します！

12時間前

!TL;DR昨今の主要な生成AI（ChatGPT, Claude, Gemini など）は、以前よりも少し慎重になったように見える。この変化は、単にモデルが賢くなったとか、Softmax の温度が変わったという話ではない。生成AIは、単なる次トークン予測器ではなく、実際にはベースモデル、alignment、policy、router、monitor といった複数の層から成るシステムとして動いている。本稿では、なぜ最近の生成AIは慎重に見えるのかなぜプロンプトだけでは制御しきれないのかなぜ構造化成果物が実務で効くのかを、内部構造と実運用の観点から整理してみる。※本稿は...

12時間前

LLMをもっと賢くする：ナレッジグラフ実践入門

AIエージェントはどう攻撃されるのか——入り口・頭脳・手足の3つの弱点

「ChatGPTは賢いのに、なぜ業務では使いにくいのか」。その答えがナレッジグラフにあります。本書は、RAGだけでは解けない問題の正体を明らかにし、ナレッジグラフがLLMに何をもたらすかを、入門から世界の活用事例、実装アーキテクチャ、AI Agentとの統合まで一気通貫で解説します。エンタープライズ規模でのKG実装は難しい。だからこそ、何が難しいのかを正確に理解することが第一歩です。

13時間前

【アップデート】AWS Config マネージドルールに 75 ルールが追加されました！

はじめにこんにちは！hyodoです！最近、LLMにツールを持たせて自律的にタスクを実行させる「AIエージェント」がどんどん普及しています。Web検索、ファイル操作、API呼び出し、メール送信——できることが増えるほど便利になりますが、その分攻撃された時の被害も大きくなります。従来のチャットボットは「変な回答をする」程度で済んでいましたが、ツール実行権限を持つエージェントが乗っ取られると、機密情報の流出やシステムの破壊といった実害に直結します。この記事では、AIエージェントがどのような仕組みで攻撃されるのかを整理します。防御策は次の記事に回して、まずは「攻撃者がどこを狙ってく...

13時間前

Blackwell 128GB VRAMの怪物マシンで音声認識を爆速化したら、ARM64 Linuxの沼にハマった話

【アップデート】AWS Config マネージドルールに 75 ルールが追加されました！

13時間前

プロローグ：128GB VRAMのGPUが手に入った「NVIDIA Blackwell。128GB VRAM。ARM64。」スペックシートを見た瞬間、心臓が跳ねた。Lenovo ThinkStation PGX——NVIDIAの「DGX Spark」互換機が手元に届いた。NVIDIAが2025年に発表した、デスクサイズのAIスーパーコンピュータ。そのOEM版だ。128GBのVRAM。MacBook Pro M4 Maxの統合メモリ128GBとは訳が違う。CUDA対応のGPUメモリが128GBだ。70Bパラメータの大規模言語モデルも量子化すれば余裕で載るし、200Bクラスのモデ...

13時間前

GPTのReact習熟度も測る

Mamba-3 登場：SSM の進化が止まらない。性能と効率を両立する次世代モデルの解説

概要以下の記事の続きです。前回の記事ではClaude Codeの3つのモデルに対してReactの習熟度を測るベンチマークを行いましたが、今回はGPT-4.1とGPT-5.4に対して同じ評価を行いました。なお、筆者はCodexを使っていないので、GitHub Copilot CLIを介してこれらのモデルを使用しています。ベンチマークの設定については前回の記事をご覧ください。https://zenn.dev/uhyo/articles/react-profession-bench-1結果スペックSonnetOpusHaikuGPT-4.1GPT-5.400.....

13時間前

【2026年版】技術力なくても推しキャラを量産！ComfyUI × LLMで自動プロンプト生成ツール「anima-pipeline」作った

Mambaシリーズの最新作「Mamba-3」が発表されました！効率的なシーケンスモデリングの先駆者である Albert Gu 氏や Tri Dao 氏らに加え、今回は学生中心のチームによって大きな進化を遂げています。なぜ Mamba-3 が注目されているのか、その背景から技術的なポイントまで、丁寧な解説ブログ形式でまとめました。AIの世界では、現在「Transformer」が主流ですが、その計算コストの高さ（入力が長くなるほど計算量が爆発する問題）が課題となっています。その代替案として注目を浴び続けているのが SSM（状態空間モデル）であり、その代表格が Mamba です。今回...

13時間前

LLM as a Judgeの結果でモデル比較をするなら、まずは点数評価より比較評価を試してみよう

はじめにComfyUIでアニメ・美少女画像生成をしていると、こんな壁にぶつかりませんか？キャラ名からDanbooruタグを毎回ググるのが面倒髪型・色・衣装・ポーズを毎回手打ちで入力するのがダルい複数キャラ同時生成したいのに設定がリセットされるLLMで自動生成させたいけどUIがなくて挫折そんな痛みを全部解決したくて、ブラウザUIでポチポチ入力するだけでLLMがDanbooruタグを自動生成 → ComfyUI Animaワークフローに一発送信できるツールを作りました。→ GitHub: https://github.com/tomotto1296/anima-pip...

13時間前

長文コンテキストをLLMが読んでくれない…を減らす — “Lost in the Middle”論文から学ぶプロンプトと分割設計

はじめにLLMを使ったプロダクトでは、LLMの出力をきちんと評価することが欠かせません。直感で「なんとなく良い」「なんとなく悪い」と判断していると、評価基準が属人化しやすくなります。さらに、品質だけでなくコストや速度とのバランスも含めて判断したい場面では、定量的に比較できないことが大きな問題になります。こうした状態のまま一度リリースしてしまうと、後から改善しにくくなりがちです。LLMで解くタスクはどんどん複雑で高度になっているので、従来のように正解を用意できるタスクばかりではありません。そこでよく使われるのが、LLMにLLMの出力を評価させるLLM as a Judge です。...

14時間前

AIを活用した大規模iOSアプリのSwift Concurrency移行戦略

はじめにルミナイR&Dチームの栗原です。「せっかく長いコンテキストを全部突っ込んだのに、モデルが肝心なところを読んでくれていない気がする……」RAG や長文プロンプトを触っていると、こんな違和感を覚える場面が出てきます。ちゃんと書いてあるのに、真ん中あたりの情報だけ無視されたような回答が返ってくる重要な注意書きを末尾に書いたら機能し始めた長文をそのまま貼ったら精度がむしろ落ちたこうした現象を、体系的に調べたのがNelson F. Liu らの “Lost in the Middle: How Language Models Use Long Context...

14時間前

ECS で別コンテナからプロセス状況を監視する方法を教えてください

はじめにこんにちは！技術本部 Sansan Engineering Unit Mobile Application Groupに所属するiOSエンジニアの劉志輝です。今回は、ビジネスデータベース「Sansan」のiOSアプリで進めている、Swift6時代に向けたSwift Concurrencyへの移行戦略についてお話しします。このアプリは10年以上にわたって継続開発されており、UIKit + VIPERアーキテクチャで構成されています。非同期処理にはRxSwift（Single、Observable、BehaviorRelay）とGCD（DispatchSemaphore、Disp…

14時間前

「AIに言われてウザかったフレーズ選手権」をアプリにした

ECS で別コンテナからプロセス状況を監視する方法を教えてください

15時間前

AIに思考を委任するな——構造的アナロジー転写という使い方

「AIに言われてウザかったフレーズ選手権」をアプリにした同僚とのチャットで「ChatGPTのウザいリプライ」で盛り上がった。ノリと勢いで「何をつぶやいてもAIがウザ絡みしてくるSNS」を作ったら、フレーズ収集が一番楽しかった。動くやつはここ → https://d2ukim6sdm7m4g.cloudfront.net/※ 事前予告なく停止してしまう可能性もあります。発端：「いや、お前に人間の何がわかんねん」ある日の社内チャット。同僚がChatGPTへの不満をぶちまけ始めた。「最近ChatGPTがちょいうざい。聞いてないのに勝手に色々outputしてくるし、『さすが...

15時間前

OpenAI to acquire Astral OpenAI News

AIに思考を委任する違和感AI開発各社は、AIの正確さを競っている。ベンチマークスコア、ハルシネーション率の低減、事実確認の精度。「より正しい答えを出せるAI」が、より優れたAIであるという前提で、業界全体が動いている。この方向性に、構造的な違和感がある。誤解のないように言うと、AIは検索、計算、コード生成、定型的な推論においては、かなり正確な出力を返す。「正解を出せない」のではない。保証された正解を、単体の判断として生成する構造を持たないのだ。大規模言語モデルは、学習データの中のパターンから統計的にもっともらしい出力を生成する仕組みであり、数学の証明のように正解を導出している...

15時間前

Accelerates Codex growth to power the next generation of Python developer tools

15時間前

カケハシ入社半年で感じたこと

KAKEHASHI Tech Blog

はじめにはじめまして、竹浪と申します。2025年8月にカケハシへエンジニアとして入社しました。現在は Pocket Musubi チームに所属しています。この記事では、入社の経緯や、半年間で感じたことをお伝えできればと思います。自己紹介・これまでの経歴 1999年に専門学校を卒業後、SI系の会社でエンジニアとしてのキャリアをスタートしました。翌年にはフリーランスに転向し、その後メガベンチャーを含むWeb企業を経て、複数のスタートアップでの開発にも携わってきました。技術スタックとしては Go、Java、PHP を中心としたバックエンド開発が主軸で、AWS や GCP を活用したインフラの…

15時間前

【非エンジニアのためのClaude/ClaudeCodeシリーズ】 Anthropic公式の"salesプラグイン"全部試してみた

Autoresearching Apple's "LLM in a Flash" to run Qwen 397B locally Simon Willison's Weblog

Claude上で使えるAnthropicの公式プラグイン"Salesプラグイン”の全機能を試してみました。

15時間前

<a href="https://twitter.com/danveloper/status/2034353876753592372">Autoresearching Apple&#x27;s &quot;LLM in a Flash&quot; to run Qwen 397B locally</a>Here's a fascinating piece of research by Dan Woods, who managed to get a custom version of <a href="https://huggingface.co/Qwen/Qwen3.5-397B-A17B/tree/main">Qwen3.5-397B-A17B</a> running at 5.5+ tokens/second on a 48GB MacBook Pro M3 Max despite that model takin...

15時間前

AI Agentの本番運用を通して学んだ3つのガードレール

株式会社ログラステックブログのフィード

!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の135週目の記事です！3年間連続達成まで残り24週となりました！はじめに：AI Agentは「動かす」より「安定させる」が難しいこんにちは、ログラスでエンジニアしている山崎です。私は2025年11月に入社して以来、AI Agentの新規事業の開発をしています。私たちはLangGraphでAI Agentを構築し、経営の実績データに対する分析コメント（以下、財務分析コメント）をLLMに生成させる機能を開発・運用しています。なお、本機能で利用するLLM APIは、入力データがモデル...

15時間前

Amazon Connect AIエージェントで質問内容に応じて複数のナレッジベースを使い分ける（選択的クエリ）方法

DuckDB v1.5.0で刷新されたCLIを試してみる

Amazon Connect AIエージェントで質問内容に応じて複数のナレッジベースを使い分ける（選択的クエリ）方法

16時間前

Claude Code スラッシュコマンド完全版：見落としがちな4つのコマンド

DuckDB v1.5.0で刷新されたCLIを試してみる

16時間前

Claude Code 完全ガイド：全32スラッシュコマンド解説

前回の「Claude Code 完全ガイド」で主要なスラッシュコマンドを紹介しましたが、実は重要なコマンドが4つ抜けていました。この記事では補完します。抜けていた4つのコマンド/model - モデル切り替え/fast - 高速モード/plan - プランニングモード/bug - バグ報告それぞれ詳しく解説します。 /model - モデル切り替え概要: 使用するClaudeモデルを切り替えます。タスクに応じて最適なモデルを選択可能。/model 使用例User: /modelClaude: 現在のモデル: claude-sonnet-4-...

17時間前

[アップデート] Kiro エンタープライズユーザー（IAM Identity Center 利用）でもオープンウェイトモデルが利用できるようになりました

Claude Code（claude.ai/code）の全32個のビルトインスラッシュコマンドを網羅的に解説します。目次会話・セッション管理プロジェクト・設定管理開発・外部連携タスク実行・レビューシステム・その他会話・セッション管理（10コマンド） /helpヘルプとコマンド一覧を表示 /clear会話履歴をクリアしてリセット /compact会話を圧縮してコンテキストを節約 /context現在のコンテキスト（トークン）使用状況を表示 /costセッションのトークン消費とコストを表示 /exitClaude ...

17時間前

Claude Code の skill に最小 observability を足して、死んだ skill と観測漏れを見つける

[アップデート] Kiro エンタープライズユーザー（IAM Identity Center 利用）でもオープンウェイトモデルが利用できるようになりました

18時間前

GlassWorm Sleeper Extensions Activate on Open VSX, Shift to GitHub-Hosted VSIX Malware

はじめにClaude Code で skill を増やしていくと、追加そのものより先に、運用の実態が見えなくなります。見えなくなるのは、たとえば次の4つです。いま実際に使われている skill は何か名前だけ残っていて、実運用ではもう死んでいる skill は何かたまに失敗しているのに放置されている skill は何か「呼ばれているはず」の処理が、そもそも観測できる経路を通っているのかskill は増やせます。でも、増えたあとに何を消すか、何を直すか、どこが見えていないかは、手元の感覚だけでは分かりにくくなります。そこで、Claude Code の skil...

21時間前

Socket

We identified over 20 additional malicious extensions, along with over 20 related sleeper extensions, some of which have already been weaponized.

21時間前

Snowflake Cortex AI Escapes Sandbox and Executes Malware Simon Willison's Weblog

<a href="https://www.promptarmor.com/resources/snowflake-ai-escapes-sandbox-and-executes-malware">Snowflake Cortex AI Escapes Sandbox and Executes Malware</a>PromptArmor report on a prompt injection attack chain in Snowflake's <a href="https://docs.snowflake.com/en/user-guide/snowflake-cortex/cortex-agents">Cortex Agent</a>, now fixed.The attack started when a Cortex user asked the agent to review a GitHu...

1日前

既存の MCP サーバーを MCP Apps 対応させて、Claude Desktop にインタラクティブ UI を表示してみた

LLM エージェントのコンテキスト戦略：Just-in-Time に必要な情報だけを注入する

既存の MCP サーバーを MCP Apps 対応させて、Claude Desktop にインタラクティブ UI を表示してみた

1日前

Node.js互換でコンテナよりも高密度と高速起動を実現する「Edge.js」、Wasmerが発表

はじめにLLM を使ったエージェントを設計するとき、わりと考えずに詰め込んでしまいがちなのが「コンテキスト」です。ドキュメント、データ、コード、会話履歴……「全部渡せば精度が上がる」と思われがちですが、現状のLLMの仕組みでは誤りです。本記事の主題は「どういったコンテキスト戦略をとるべきか」です。以下の内容を解説します。コンテキストウィンドウが大きくなっても変わらない LLM の本質的な性質Just-in-Time Context — 必要な情報を、必要なときに、必要なだけ注入するのが原則コンテキスト戦略の具体例（Agent Skills / データパイプライン / ...

1日前

Claude Code の権限評価フローを「セキュリティ」だと思っていた

WebAssemblyランタイム「Wasmer」を開発提供するWasmer社は、Node.js互換かつコンテナよりも高密度な集約と高速起動を実現する「[Edge.js](https://edgejs.org/)」を発表しました。 What ...

1日前

3/18 (水)

低スペックAndroidにローカルLLM(llama.cpp)を導入する

Claude Code を導入した翌日、チームのセキュリティ担当からこう聞かれた。「エージェントが外部に通信しないことは保証されているか？」あなたは deny ルールに WebFetch を追加して「対処済み」と答えた。それは本当に正しかったのか。「権限評価フロー」という名前が誤解を生むClaude Code のドキュメントには、ツール呼び出し時の評価順序が示されている。PreToolUse Hook → Deny Rules → Allow Rules → Ask Rules → Permission Mode → canUseTool Callback多くの解説記事はこ...

1日前

4Bモデルがモンティホール問題を解いた——Qwen3:4b 24問ローカルベンチマーク

概要低スぺAndroidに限らず、AndroidでローカルLLM(llama.cpp)を導入する手順を記録した。今回使用した低スぺAndroidはPlayStoreがプリインストールされていないので、使用可能なリソースには実は幾分猶予があります。PlayStore導入済みの普通の低スぺAndroidだと、うまく動かないこともあるかと思いますのでご注意ください。(マネする人はいないと思いますが...) 動機ちょっと前に3coinsのタブレットのスペックがひどいと話題になったが、そういった低スペックのAndroid端末でマシンリソースが要求されるLLMが動いたら面白いだろうなと...

1日前

非技術者がAIコーディングエージェントで趣味サイトを作ってみた

4Bモデルがモンティホール問題を正解する時代が来た。それは本当だった。ただし「蛙は夏の季語です」とも言い切った。同じモデルが。スコアカテゴリスコアA: 意地悪・引っかけ57/60（95%）B: 論理・推論57/60（95%）C: コーディング37/60（62%）D: 日本語力31/60（52%）合計182/240（75.8%）ランクA環境：RTX 4070 Ti + Ollama v0.17.4。推論速度 104.8 tok/s。VRAM消費約3.5GB。この数字は素直に速い。 A・Bカテゴリで95%という数字...

1日前

Godot と Codex で 3 つの題材を試してみたら、初回出力の強さと人手確認の重さが見えてきた

非技術者がAIコーディングエージェントで趣味サイトを作ってみた

1日前

複数リポジトリでClaude Codeのルール・スキルを一元管理する

Godot 4.6.1 と Codex を使い、2D アクション、小規模対戦マルチプレイ、EditorPlugin ベースの制作支援ツールを検証しました。初回の土台作成はかなり速い一方、細かな粗さの最終補正には人手の確認が欠かせないことが分かりました。

1日前

複数リポジトリでClaude Codeのルール・スキルを一元管理する

1日前

What Is the PARK Stack?

ブラウザを自然言語で操作する Claude in Chrome を使ってみた

Background: Stacks with four-letter acronyms According to Wikipedia, the LAMP stack was coined in 1998 by Michael Kunze to describe what had emerged as a popular open source software stack for websites. When the World Wide Web exploded in popularity earlier in the ’90s, organizations used an ad hoc mixture of proprietary tools and operating […]

1日前

【Security Hub修復手順】[Route53.2] Route 53 のパブリックホストゾーンは DNS クエリをログに記録する必要があります

Claude in Chrome を使って、2026年3月の運賃改定前後の IC 運賃を自動で調べてみました。使い方、向いている作業、セキュリティ上の注意点をまとめています。

1日前

「AI開発ツールの使い分けと、Cursorを選ぶ理由」というテーマで登壇しました

AWS SecurityHub 基礎セキュリティのベストプラクティスコントロール修復手順をご紹介します。

1日前

GitHub Actions　✕　Claude CodeのスキルでGitHub Projectsからプロジェクトの進捗状況を取得・分析してSlackに通知してみた

「AI開発ツールの使い分けと、Cursorを選ぶ理由」というテーマで登壇しました

1日前

การ Deploy Web Application ด้วย AWS Elastic Beanstalk

GitHub Projects上の進捗変化を毎日自動で分析してSlackに報告する仕組みを構築してみました。GitHub ActionsからClaude Codeのスキルを定期実行し、前日との差分を比較することでステータス変更や予定の変更を定量的に把握できるようになります。これでプロジェクトのリスク管理が省力できるかも？

1日前

[アップデート] Amazon CloudWatch LogsがHTTPリクエスト経由でログを取り込めるようになりました

บทความนี้เป็นส่วนหนึ่งของซีรีย์บทเรียน"Deploy Web Application Platform PHP ด้วย AWS Elastic Beanstalk" ที่ผมได้ทดลองทำแล้วสำเร็จ จึงอยากนำมาแบ่งปันความรู้ให้ผู้ที่สนใจได้อ่านครับ โดยเนื้อหาในแต่ละบทความสามารถทำตามได้อย่างอิสระ เหมาะสำหรับผู้ที่เริ่มต้นสร้างเว็บไซต์ซึ่งจะมีทั้งหมด 6 ขั้นตอน สามารถทำตามได้ครับ

1日前

野良 Agent Skills (Claude Code Skills) に潜むリスク

エンドポイントにHTTPリクエストを送るだけで、Amazon CloudWatch Logsのログを発行できるようになったぞ！

1日前

LINEヤフーのエンジニアの動向を知る：State of LY 2025実施レポート LINEヤフー Tech Blog (LY Corporation Tech Blog

野良 Agent Skills (Claude Code Skills) に潜むリスク

1日前

LINEヤフーでは、2024年に引き続き、2025年も社内の開発者を対象としたアンケート「State of LY 2025」を実施しました（昨年度の実施レポート）。昨年はWebフロントエンド開発者のみ...

1日前

LINE iOSアプリにWebKitの新API「WebPage」を導入できず、自前で実装した件 LINEヤフー Tech Blog (LY Corporation Tech Blog

はじめにこんにちは、iOSアプリエンジニアのKiichiです。LINE iOSアプリでアプリ内ブラウザなど、Webまわりの開発を担当しています。普段はUIKitをベースに機能改善や新機能開発を進めつつ...

2日前

cdk8s の Helm 実行結果をキャッシュしてマニフェスト生成を高速化した

Cybozu Inside Out | サイボウズエンジニアのブログ

この記事は kintone 生成 AI チームで連載中の kintone AI リレーブログ 2026 の 10 本目の記事です。リレーブログでは生成 AI チームのメンバーが AI トピックに限らず、さまざまなことについて発信していきます。こんにちは！ kintone の生成 AI チームでソフトウェアエンジニアをやっている福田です。私たちのチームでは cdk8s を使って Kubernetes マニフェストを管理しています。（cdk8s の詳細は別の記事で紹介していますので、あわせてご覧ください。）cdk8s を使うと TypeScript でマニフェストが書けるだけでなく、Helm チャートと統合したマニフェスト管理も簡単に行うことができて非常に便利なのですが、YAML のマニフェスト生成に時間がかかることがチーム内でも問題になっていました。Kubernetes へのデプロイは、cdk8s で生成した YAML のマニフェストを apply するという方法で行っており、その生成に時間がかかってしまうと、開発のイテレーションが遅くなってしまいます。今回はマニフェスト生成が遅いという

2日前

2026年4月の技術系イベント予定 LINEヤフー Tech Blog (LY Corporation Tech Blog

LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...

2日前

Nemotron 3 Nano 4Bを試す。Qwen3.5やQwen3のほうがいいかも

Sansanのデータ化オペレーションを支えるデータ基盤hydra

Nemotron 3 Nano 4Bというのが出ていたので、Q8_0で試してみます。 Nemotron 3 Nano 4B: A Compact Hybrid Model for Efficient Local AI 結論でいうと、Qwen3-4BやQwen3.5-4Bよりいい点はあまり見当たりませんでした。知識カットオフは？ 2024-6っぽいけど、なかなか・・・「きしだ」というのはあってそうだけど、 Qwen3.5-4Bは、石破さんは102代だけどだいたいあってて、知識も新しい。 Qwen3-4Bは読み方以外は正しい。知識はちょい古い。日本知識どこのことを言ってる？ Qwen3.5…

2日前

NTT docomo Business Engineers' Blog

技術本部Digitization部Platform Engineeringグループの湯村です。Sansanでは、名刺や請求書などの情報を正確なデータへ変換するために、AIによる自動処理と人による補正を組み合わせた大規模な運用体制を構築しています。この記事では、こうしたデータ化の運用を拡大する中で直面した課題と、それを解決するために構築したデータ基盤hydraの設計について紹介します。

2日前

「自分でやり切る」だけでチームは強くならない

NTTドコモビジネスイノベーションセンターテクノロジー部門 MetemcyberPJでの経験を通じ、私は「自分でやり切ること」と「チームとして成果を出すこと」のバランスの重要性を学びました。若手社員でも幅広い業務に挑戦できる環境の中で、責任感を持ちながらも周囲と協力することで、個人の成長とチーム成果の両立が可能であると実感しています。この記事では、その経験から得た学びと実践のポイントを紹介します。はじめに若手でも幅広く挑戦できる環境スクラムという前提私が経験した「抱え込み」タスクの優先順位のつけ方最後にはじめにこんにちは。イノベーションセンターテクノロジー部門 Metem…

2日前

40,000行のAPIテスト作成で学んだClaude Code Skillsの育て方

カミナシエンジニアブログ

こんにちは、ソフトウェアエンジニアの渡邉（匠）です。「カミナシ設備保全」の開発に携わっています。 Claude CodeのSkills（以下スキル）を使い、約2週間で40,000行超のAPIシナリオテストを書き切りました。最初のスキルは粗削りでしたが、テストを量産する中で繰り返し改善した結果、後半は「スキル実行 → レビュー → マージ」のサイクルだけで回せるようになりました。この記事では、スキルをどう設計し、どう育てたかを中心にお伝えします。背景 APIの動作保証にシナリオテストツール runn を使っていました。サービス成長に伴うAPIの増加により、当初のテスト構成では運用が回らな…

2日前

Quoting Ken Jin Simon Willison's Weblog

<blockquote cite="https://fidget-spinner.github.io/posts/jit-on-track.html">Great news—we’ve hit our (very modest) performance goals for the CPython JIT over a year early for macOS AArch64, and a few months early for x86_64 Linux. The 3.15 alpha JIT is about 11-12% faster on macOS AArch64 than the tail calling interpreter, and 5-6%faster than the standard interpreter on x86_64 Linux.</blockquote><p class...

2日前

Google Research at The Check Up: from healthcare innovation to real-world care settings

The latest research from Google

Health & Bioscience

2日前

GPT-5.4 mini and GPT-5.4 nano, which can describe 76,000 photos for $52 Simon Willison's Weblog

OpenAI today: <a href="https://openai.com/index/introducing-gpt-5-4-mini-and-nano/">Introducing GPT‑5.4 mini and nano</a>. These models join GPT-5.4 which was released <a href="https://openai.com/index/introducing-gpt-5-4/">two weeks ago</a>.OpenAI's self-reported benchmarks show the new 5.4-nano out-performing their previous GPT-5 mini model when run at maximum reasoning effort. The new mini is also 2x faster than the previous mini....

2日前

Improving breast cancer screening workflows with machine learning

The latest research from Google

Health & Bioscience

2日前

Quoting Tim Schilling Simon Willison's Weblog

<blockquote cite="https://www.better-simple.com/django/2026/03/16/give-django-your-time-and-money/">If you do not understand the ticket, if you do not understand the solution, or if you do not understand the feedback on your PR, then your use of LLM is hurting Django as a whole. [...]For a reviewer, it’s demoralizing to communicate with a facade of a human.This is because contributing to open source, especially Django, is a communal endeavor....

2日前

JavaにJavaScriptエンジン「V8」とPythonランタイム「CPython」を組み込む「Project Detroit」、オラクルが発表

「Java 26」正式リリース。HotSpotの起動高速化、HTTP/3クライアント対応など新機能

オラクルは、カリフォルニア州レッドウッドシティで開幕したイベント「JavaOne 2026」で、「Project Detroit」（以下、Detroit）をOpenJDKのプロジェクトプロポーザル（プロジェクト提案）として発表しました。 D...

2日前

福岡Rubyist会議05に行ってきました！

Timee Product Team Blog

福岡Rubyist会議05 参加レポートこんにちは！Timeeでバックエンドエンジニアをしている志賀(@akitoshiga)です。表題の通り「福岡Rubyist会議05 」に参加してきたのでそちらのレポートを書きたいと思います！ regional.rubykaigi.org 今回「Kaigi Pass」という社内制度を利用して参加しました。「Kaigi Pass」とは、世界中で開催されているすべての技術カンファレンスに無制限で参加できる制度です。 productpr.timee.co.jp 会場の様子当日は福岡県福岡市博多区にある「リファレンス駅東ビル」というところで行われました。 …

2日前

Subagents Simon Willison's Weblog

オラクルはJavaの最新バージョン「Java 26」正式版のリリースを発表しました。日本時間で今日（2026年3月18日）未明にカリフォルニア州レッドウッドシティで開幕したJavaOne 2026でも、Java 26のリリースが紹介されまし...

2日前

3/17 (火)

<a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt; LLMs are restricted by their context limit - how many tokens they can fit in their working memory at any given time. These values have not increased much over the past two years even as the LLMs themselves have seen dramatic improvements in their abilities - they generally top out at around 1,...

2日前

Stop Closing the Door. Fix the House.

OpenAI Japan announces Japan Teen Safety Blueprint to put teen safety first OpenAI News

The following article originally appeared on Angie Jones’s website and is being republished here with the author’s permission. I’ve been seeing more and more open source maintainers throwing up their hands over AI-generated pull requests. Going so far as to stop accepting PRs from external contributors. If you’re an open source maintainer, you’ve felt this […]

2日前

OpenAI Japan announces the Japan Teen Safety Blueprint, introducing stronger age protections, parental controls, and well-being safeguards for teens using generative AI.

2日前

Introducing GPT-5.4 mini and nano OpenAI News

GPT-5.4 mini and nano are smaller, faster versions of GPT-5.4 optimized for coding, tool use, multimodal reasoning, and high-volume API and sub-agent workloads.

2日前

ai.rakuten.co.jpで動いてるのはSonnet？->GPT系っぽい

Vol.12 GKEにIAPを適用してコア機能に集中しよう

楽天からRakutenAI-3.0がApache 2.0ライセンスで公開されていました。DeepSeek V3アーキテクチャの671B-A37Bのモデルです。 https://huggingface.co/Rakuten/RakutenAI-3.0 ということで、とりあえずai.rakutenで試してみようと思ったのですね。自社のフラグシップモデルを使ってるだろうと思って。 https://ai.rakuten.co.jp/chat で、ブロック崩しを作ってもらったら、こういうきれいなブロック崩しを作ってきました。パーティクルだけ後付け。「おぉすごい」と思ったのだけど、いろいろ試すと、ちょ…

2日前

ベクトル検索エンジンValdの長期運用で見えたパフォーマンス最適化とベストプラクティス LINEヤフー Tech Blog (LY Corporation Tech Blog

技術本部Data Intelligence Engineering Unitのスタッフソフトウェアエンジニア藤原です。 Sansan Data Intelligence開発Unitブログリレーのvol.12として、少し趣向を変えて、今日はGoogle Cloudのちょっとだけマニアックだけど便利な機能、IAP（Identity-Aware Proxy）の活用について紹介します。

2日前

はじめに私たちは、社内のプラットフォームにおいて、Cloud NativeなANN（近似最近傍探索）ベクトル検索エンジン「Vald」のマネージドシステムを約4年間にわたり運用・開発してきました。本記事...

3日前

Equipping workers with insights about compensation OpenAI News

New research shows Americans send nearly 3 million daily messages to ChatGPT asking about compensation and earnings, helping close the wage information gap.

3日前

Async React の設計思想と Signal の違いを Transition を中心に考える

KAKEHASHI Tech Blog

ランキング参加中プログラミングこんにちは。フロントエンドエンジニアをしているNokogiri（@nkgrnkgr）です。はじめに私たちのReactをつかったプロダクトでは Suspense をデータフェッチに利用しています。useTransition や useOptimistic も触ったことはありましたが、プロダクションでどう活かすかという解像度がまだ上がっていませんでした。そんなとき、uhyo さんの「React 19時代のコンポーネント設計ベストプラクティス」や「Async Reactとは何か」を読んで、Async React の全体像をちゃんと理解したくなりました。実際にコー…

3日前

Introducing Mistral Small 4 Simon Willison's Weblog

<a href="https://mistral.ai/news/mistral-small-4">Introducing Mistral Small 4</a>Big new release from Mistral today (despite the name) - a new Apache 2 licensed 119B parameter (Mixture-of-Experts, 6B active) model which they describe like this:<blockquote>Mistral Small 4 is the first Mistral model to unify the capabilities of our flagship models, Magistral for reasoning, Pixtral for multimodal, and Devstral for...

3日前

Use subagents and custom agents in Codex Simon Willison's Weblog

<a href="https://developers.openai.com/codex/subagents">Use subagents and custom agents in Codex</a>Subagents were announced in general availability today for OpenAI Codex, after several weeks of preview behind a feature flag.They're very similar to the Claude Code implementation, with default subagents for "explorer", "worker" and "default". It's unclear to me what the difference between "worker" and "default" is bu...

3日前

Quoting A member of Anthropic’s alignment-science team Simon Willison's Weblog

<blockquote cite="https://www.newyorker.com/news/annals-of-inquiry/the-pentagon-went-to-war-with-anthropic-whats-really-at-stake?_sp=9a6e0ff7-2bfd-46f8-a9e1-3941ef2003b5.1773495048769">The point of <a href="https://simonwillison.net/2025/Jun/20/agentic-misalignment/">the blackmail exercise</a> was to have something to describe to policymakers—results that are visceral enough to land with people, and make misalignment risk actually salient in practice for people who ha...

3日前

Quoting Guilherme Rambo Simon Willison's Weblog

<blockquote cite="https://daringfireball.net/2026/03/apple_enclaves_neo_camera_indicator">Tidbit: the software-based camera indicator light in the MacBook Neo runs in the secure exclave¹ part of the chip, so it is almost as secure as the hardware indicator light. What that means in practice is that even a kernel-level exploit would not be able to turn on the camera without the light appearing on screen. It runs in a privileged environment separate from the kernel and blits the li...

3日前

Coding agents for data analysis Simon Willison's Weblog

<a href="https://simonw.github.io/nicar-2026-coding-agents/">Coding agents for data analysis</a>Here's the handout I prepared for my NICAR 2026 workshop "Coding agents for data analysis" - a three hour session aimed at data journalists demonstrating ways that tools like Claude Code and OpenAI Codex can be used to explore, analyze and clean data.Here's the table of contents:<blockquote><ul><li...

3日前

Testing LLMs on superconductivity research questions

The latest research from Google

Education Innovation

3日前

データセンターが武力紛争時の攻撃目標になる時代。中東の武力紛争で両陣営ともにデータセンターを狙った攻撃を実行

How coding agents work Simon Willison's Weblog

日本時間3月1日に行われた米国とイスラエルによるイランへの攻撃開始から約2週間が経過した中東における武力紛争は、データセンターが明確な攻撃目標としてクローズアップされた歴史上初めての武力紛争になりました。この紛争における両陣営のデータセン...

3日前

3/16 (月)

<a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt; As with any tool, understanding how <a href="https://simonwillison.net/guides/agentic-engineering-patterns/what-is-agentic-engineering/">coding agents</a> work under the hood can help you make better decisions about how to apply them.A coding agent is a piece of software that acts as a <s...

3日前

A Fraudster’s Paradise

TC39 Advances Temporal to Stage 4 Alongside Several ECMAScript Proposals

Dark web forum posts mentioned the phrase “AI agent” far more in the second half of 2025 than in the first half. Could this mean that fraudsters are charmed by the AI hype? Or is AI truly a game changer for cybercrime? AI-related discussions—evident both in what “the bad guys” are saying and in what […]

3日前

Socket

TC39’s March 2026 meeting advanced eight ECMAScript proposals, including Temporal reaching Stage 4 and securing its place in the ECMAScript 2026 specification.

4日前

「LINEヤフー Development with Agents Meetup #2」を開催しました！（イベントレポート） LINEヤフー Tech Blog (LY Corporation Tech Blog

こんにちは。LINEヤフーの永吉です。2月24日（火）、「LINEヤフー Development with Agents Meetup #2」を開催しました。今回のMeetupは、Orchestrat...

4日前

わずか9秒の「事前タスク」でクラウドソーシング実験のデータ品質向上（CHI 2026採択論文解説） LINEヤフー Tech Blog (LY Corporation Tech Blog

こんにちは。LINEヤフー研究所でヒューマンコンピュータインタラクション（HCI）分野の研究をしている山中です。クラウドソーシングで収集したデータを使って、とても精度が良いとされているモデルに当てはめ...

4日前

Vol. 24 Bill One開発Unit ブログリレー2025終幕

Why Codex Security Doesn’t Include a SAST Report OpenAI News

はじめにこんにちは！技術本部 Bill One Engineering Unitの今村です。2025年4月に新卒でSansanに入社しました。あと少しで入社して1年が経つところです。 2025年11月12日に投稿した「Vol. 00 Bill One開発Unit ブログリレー2025を開催！& アーキテクチャConference 2025に協賛します！」で言及した通り、Bill One開発Unit ブログリレー2025を実施しました。エンジニアに加えて、デザイナーやQA、Bill Oneのプロダクト開発責任者など、多くのメンバーが参加し計24本のブログを執筆しました。本記事では、ブログリレ…

4日前

A deep dive into why Codex Security doesn’t rely on traditional SAST, instead using AI-driven constraint reasoning and validation to find real vulnerabilities with fewer false positives.

4日前

What is agentic engineering? Simon Willison's Weblog

<a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt; I use the term agentic engineering to describe the practice of developing software with the assistance of coding agents.What are coding agents? They're agents that can both write and execute code. Popular examples include <a href="https://code...

4日前

ViteネイティブなWebプラットフォーム「Void」発表。Cloudflareの上に構築されたフルスタックの実行環境

JavaScriptの統合ツールチェーン「Vite+」がオープンソースで公開

JavaScriptのバンドルツール「Vite」などを開発しているVoidZeroは、ViteからシームレスにデプロイできるViteネイティブなWebアプリケーションプラットフォーム「Void」を発表しました。 VoidはCloudflar...

4日前

ビルドツール「Vite 8.0」正式リリース。Rustベースの新バンドラ「Rolldown」採用でより一貫した動作や最適化を実現

JavaScriptのESモジュールに対応した高速なビルドツール「Vite」などを開発しているVoidZeroは、Viteを含むJavaScriptの統合開発ツールチェーン「Vite+」アルファ版をオープンソースで公開しました（GitHub...

4日前

Quoting Jannis Leidel Simon Willison's Weblog

JavaScriptのESモジュールに対応した高速なビルドツール「Vite」の最新版「Vite 8.0」正式版がリリースされました。 Vite 8.0 is here!The most significant architectural ...

4日前

3/15 (日)

<blockquote cite="https://jazzband.co/news/2026/03/14/sunsetting-jazzband">GitHub’s <a href="https://www.theregister.com/2026/02/18/godot_maintainers_struggle_with_draining/">slopocalypse</a> – the flood of AI-generated spam PRs and issues – has made Jazzband’s model of open membership and shared push access untenable.Jazzband was designed for a world where the worst case was someone accidentally merging the wrong PR. In a world where <a href="ht...

5日前

My fireside chat about agentic engineering at the Pragmatic Summit Simon Willison's Weblog

I was a speaker last month at the <a href="https://www.pragmaticsummit.com/">Pragmatic Summit</a> in San Francisco, where I participated in a fireside chat session about <a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering</a> hosted by Eric Lui from Statsig.The video is <a href="https://www.youtube.com/watch?v=owmJyKVu5f8">available on YouTube</a>. Here are my highlights from the conversatio...

5日前

3/14 (土)

FASTとスクラムに学ぶ、不確実性への2つのアプローチ

株式会社ログラステックブログのフィード

はじめに現代のソフトウェア開発において、「先のことを正確に予測する」ことが、かつてないほど難しくなっていると感じませんか？時間をかけて精緻なスケジュールを引いても、開発を始めた途端に前提条件が変わることは、もはや当たり前になってきました。意図しなかった技術的な依存関係が見つかる、ステークホルダーの要望が変化する、競合他社が予期せぬ機能をリリースする。そして、仮に予定通りに作りきったとしても、そもそも使ってもらえない。このように「当初の計画通りに進まない」という事象は、VUCA と呼ばれる時代においては避けて通ることが難しくなってきています。この記事では、私が実践してきた...

5日前

Anker USB-C & USB-C Thunderbolt 4 100W ケーブル 0.7m - 橋本商会 - Cosense

JapanNext 31.5インチモニタ JN-IPS315UHDR-C90W-HSP - 橋本商会 - Cosense

8Kの映像が出せて、同時に100WでUSB Power Deliveryで充電もできるUSB-Cケーブルhttps://www.ankerjapan.com/products/a8859JapanNext 31.5インチモニタ JN-IPS315UHDR-C90W-HSPのために買った

5日前

72 Malicious Open VSX Extensions Linked to GlassWorm Campaign Now Using Transitive Dependencies

9年使ったiiyama 31.5インチモニタ X3291HS-B1から買い替えたshokai.icon Retinaディスプレイで撮影した画像の正しいスケールでの表示ができるようになったらようやく普段使っている液晶ディスプレイの解像度が気になってきた為#買ったサイズ感は同じだが、dpiが縦も横も2倍になった文字が読みやすすぎてワロタshokai.iconhttps://jp.japannext.com/products/jn-ips315uhdr-c90w-hsphttps://www.yodobashi.com/product/100000001008680260/ 5.4万円モニタ付属の新しいHDMIケーブルでは、4k 30Hz出力しかできなかった

5日前

Socket

Since January 31, 2026, we identified at least 72 additional malicious Open VSX extensions, including transitive GlassWorm loader extensions targeting developers.

6日前

Software Craftsmanship in the Age of AI

1M context is now generally available for Opus 4.6 and Sonnet 4.6 Simon Willison's Weblog

On March 26, Addy Osmani and I are hosting the third O’Reilly AI Codecon, and this time we’re taking on the question of what software craftsmanship looks like when AI agents are writing much of the code. The subtitle of this event, “Software Craftsmanship in the Age of AI,” was meant to be provocative. Craftsmanship […]

6日前

<a href="https://claude.com/blog/1m-context-ga">1M context is now generally available for Opus 4.6 and Sonnet 4.6</a>Here's what surprised me:<blockquote>Standard pricing now applies across the full 1M window for both models, with no long-context premium.</blockquote>OpenAI and Gemini both <a href="https://www.llm-prices.com/#sel=gemini-3-1-pro-preview-200k%2Cgpt-5.4-272k%2Cgemini-3-...

6日前

Quoting Craig Mod Simon Willison's Weblog

<blockquote cite="https://craigmod.com/essays/software_bonkers/">Simply put: It’s a big mess, and no off-the-shelf accounting software does what I need. So after years of pain, I finally sat down last week and started to build my own. It took me about five days. I am now using the best piece of accounting software I’ve ever used. It’s blazing fast. Entirely local. Handles multiple currencies and pulls daily (historical) conversion rates. It’s able to ingest any CSV I throw at it ...

6日前

3/13 (金)

Capability Architecture for AI-Native Engineering

Retinaディスプレイで撮影した画像の正しいスケールでの表示 - 橋本商会 - Cosense

A few years into the AI shift, the gap between engineers is not talent. It’s coordination: shared norms and a shared language for how AI fits into everyday engineering work. Some teams are already getting real value. They’ve moved beyond one-off experiments and started building repeatable ways of working with AI. Others haven’t, even when […]

6日前

RxJava → Coroutinesの置き換えをAIで6倍速にした話

ブラウザ側でのスケール推定アップロード前にPNGのpHYs chunkを読んでスケールを計算するこの処理がMacは72dpiベースで、Windowsは96dpiベースで計算しないと狂うのがめんどくさいアップロード時にスケール情報も送信するサムネイル作成サーバー側でも、pHYs chunkからスケール情報を取得するサムネイルの最大サイズを調整する 2xスケールの画像のサムネイルは縦も横も最大2倍で作らないと、小さく表示されてしまう streamを2つ使う元々、Google Cloud Storageからstreamでcloud functionのImageMagickに渡して、さらに出先もGoogle Cloud Storageにstreamingしている streamを開く前にスケール情報を確定する必要がある先頭8KBだけ読んで、pHYsを見てスケール確定したらすぐ切断するstreamを用意スケール確定後、既存のGCS→imagemagic→GCSのstreamを動かす

6日前

Shopify/liquid: Performance: 53% faster parse+render, 61% fewer allocations Simon Willison's Weblog

はじめにこんにちは。技術本部 Sansan Engineering Unit Mobile Applicationグループの鎌田です。2022年8月にSansanに中途入社し、SansanのAndroidアプリ開発およびiOSアプリ開発に携わっています。この記事は同じくMobile Applicationグループの朴との共著でお届けします。 Mobileチームでは「技術負債返済」をテーマとしたTech Blogリレー企画を行っています。本記事はその第７弾です。技術負債解消に向けた継続的運用の試み(2025-09-01) 10年もののSansan Mobileで負債・リスクに向き合う(20…

6日前

<a href="https://github.com/Shopify/liquid/pull/2056">Shopify/liquid: Performance: 53% faster parse+render, 61% fewer allocations</a>PR from Shopify CEO Tobias Lütke against Liquid, Shopify's open source Ruby template engine that was somewhat inspired by Django when Tobi first created it <a href="https://simonwillison.net/2005/Nov/6/liquid/">back in 2005</a>.Tobi found dozens of new performance micro-opti...

6日前

コード調査からタスク分割まで、機能設計の初動を自動化する

株式会社ログラステックブログのフィード

!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の134週目の記事です！3年間連続達成まで残り25週となりました！はじめに: 機能開発の初期フェーズ、毎回つらくないですか？新しい機能の開発を始めるとき、こんな作業が毎回発生します。既存コードの調査 - 関連するドメインモデル、API定義、フロントエンドの実装を読むPRD（Product Requirements Document）の作成 - 設計方針、詳細設計、影響範囲をまとめる技術実装PRDタスク分割 - PRをどう分けるか、依存関係はどうか、レビュー可能な粒...

7日前

サイボウズは JaSST'26 Tokyo で協賛＆登壇します！

Cybozu Inside Out | サイボウズエンジニアのブログ

こんにちは、OfficeMobileチームでQAエンジニアをしている小竹です。サイボウズは 2026年3月20日（金）に開催されるソフトウェアテストのシンポジウムJaSST'26 Tokyoにスポンサーとして協賛します。今回はスポンサーセッションに弊社のメンバーが登壇し、生成AIを組み込んだ製品のテストについてお話しする予定です。本記事ではこちらのセッション、およびJaSST'26 Tokyoの後に開催を予定しているアフターイベントについてご案内させてください。LLMでもいつものテスト技術〜意外と半分はこれまでのテストでした〜日時3月20日（金） 14:25（J3-2）タイムテーブル登壇者水谷太一（@dog_dog_3dog）内容紹介LLMアプリのテストについて知見がなく、どう進めるべきか悩んでいました。しかし、実際にリスク分析からテストスイートを積み上げると、テストの半分は従来型のシステムテストでした。AIもシステムの一部であり、品質保証のこれまでの考え方が十分通用しました。本セッションでは「従来のシステムテストで何を見たのか」、そして「LLM独自のテストをどう設計したのか

7日前

Nemotron 3 Superを試す。コードは堅実に書ける。

PostgreSQL 18からNOT NULL制約をNOT VALIDで追加できるようになりました

NVIDIAからNemotron 3シリーズの中間サイズ、Superが出ました。120B-A12Bです。 100万トークン対応なのだけど、100万トークン設定でも96GBしか使わない。MoEとMambaのおかげかな。要約が残念だったり、日本語の扱いは30BのNemotron 3 Nanoのほうがいい気がする。 NVIDIAのLLM、Nemotron 3 Nanoは賢いけどコーディングには向かないかも。Mamba 2の特性が悪く出てる？ - きしだのHatena コードはちゃんと書きます。型エラーも出していない。あと、サーバーを実装したらcurlで動作確認をちゃんとやったりします。けど、HTM…

7日前

エムスリーテックブログ

こんにちは！デジスマチームの山田です。これはデジスマチームのブログリレー3日目の投稿です。本番稼動中のデータベースの運用において、NOT NULL制約を持たせたいカラムを既存のテーブルに追加する作業は頭を悩ませるものです。PostgreSQL 11（以下、PG11）以降、DEFAULTを固定の値で指定した場合のカラム追加は高速化されました。しかしDEFAULTとして固定値を用意するのではなく、各行ごとに異なる値の非NULLなカラムを追加したいというケースもあります。このような場合「一度NULLを許可してカラムを追加し、アプリケーションの改修やUPDATEによるバックフィルを完了させた後にN…

7日前

Vol.11 Sansan Data Intelligenceの爆速リリースを支える開発フロー

MALUS - Clean Room as a Service Simon Willison's Weblog

この記事は、Sansan Data Intelligence開発Unitブログリレーの Vol.11 です。こんにちは、技術本部Data Intelligence Engineering Unit Data Intelligence Groupでインターンをしている仲野です。今回のブログでは、インターンとしてアサインされた私がキャッチアップを行い、すぐに軌道に乗ることができた、Sansan Data Intelligence（SDI）のアプリケーションサイドの開発フローを紹介します。 Sansan Data IntelligenceのArchitecture SDIの開発において、Arch…

7日前

<a href="https://malus.sh/">MALUS - Clean Room as a Service</a>Brutal satire on the whole vibe-porting license washing thing (<a href="https://simonwillison.net/2026/Mar/5/chardet/">previously</a>):<blockquote>Finally, liberation from open source license obligations.Our proprietary AI robots independently recreate any open source project from scratch. The result? Leg...

7日前

Coding After Coders: The End of Computer Programming as We Know It Simon Willison's Weblog

<a href="https://www.nytimes.com/2026/03/12/magazine/ai-coding-programming-jobs-claude-chatgpt.html?unlocked_article_code=1.SlA.DBan.wbQDi-hptjj6">Coding After Coders: The End of Computer Programming as We Know It</a>Epic piece on AI-assisted development by Clive Thompson for the New York Times Magazine, who spoke to more than 70 software developers from companies like Google, Amazon, Microsoft, Apple, plus other individuals including ...

7日前

Quoting Les Orchard Simon Willison's Weblog

<blockquote cite="https://blog.lmorchard.com/2026/03/11/grief-and-the-ai-split/">Here's what I think is happening: AI-assisted coding is exposing a divide among developers that was always there but maybe less visible.Before AI, both camps were doing the same thing every day. Writing code by hand. Using the same editors, the same languages, the same pull request workflows. The craft-lovers and the make-it-go people sat next to each other, shipped the same produc...

7日前

静的サイトジェネレータ「Astro 6.0」正式リリース。開発環境としてCloudflare Workers対応。Rust製コンパイラの実験的追加など