直近1週間の更新
3/25 (水)

American Express Leverages Service and Security to Win Agentic Commerce
PYMNTS.com
American Express sees agentic commerce and commercial services as opportunities to continue the company’s growth, Chairman and CEO Stephen J. Squeri wrote in a letter to shareholders released Wednesday (March 25). The rise of agentic commerce represents one of the biggest changes in shopping since the advent of eCommerce, Squeri wrote. It also adds […]The post American Express Leverages Service and Security to Win Agentic Commerce appeared first on PYMNTS.com.
32分前

Tether Taps Big Four Accounting Firm for Inaugural Audit
PYMNTS.com
Stablecoin issuer Tether says it has engaged a “Big Four” accounting firm for its inaugural audit. The company’s “first full independent financial statement audit” is “slated to be the biggest ever inaugural audit in the history of financial markets,” Tether said in a Tuesday (March 25) news release. Tether’s USDT coin has a market capitalization of a […]The post Tether Taps Big Four Accounting Firm for Inaugural Audit appeared first on PYMNTS.com.
2時間前

Amazon, Perplexity and OpenAI Compete to Own the First Click in Healthcare
PYMNTS.com
Amazon expanded its Health AI agent from the One Medical app to Amazon.com and the Amazon mobile app, and Perplexity launched Perplexity Health, a suite of personal health data connectors. The same week, lab testing company Function announced a connector that lets its members pipe lab results and clinician-reviewed summaries directly into Perplexity Health. […]The post Amazon, Perplexity and OpenAI Compete to Own the First Click in Healthcare appeared first on PYMNTS.com.
2時間前

Branch and Stripe Launch Digital Wallet for Worker Payouts
PYMNTS.com
Workforce payments platform Branch has launched an integration with financial services company Stripe. This collaboration, announced Wednesday (March 25), is designed to make it easier for companies to launch a digital wallet and debit card via Stripe Issuing for worker payouts. “Stripe has built one of the most powerful ecosystems for platforms and marketplaces, […]The post Branch and Stripe Launch Digital Wallet for Worker Payouts appeared first on PYMNTS.com.
2時間前

シーメンスが提唱する「全てがデータ起点の製造業」を丸2時間体験してきた
DevelopersIO
シーメンスDEX-Tokyoを訪問し、ECM(エンジニアリングチェーン)とSCM(サプライチェーン)の両面から、デジタルエンタープライズの全体像を丸2時間体験してきました。標準化、バーチャルコミッショニング、IT-OT統合まで、デモの様子を交えたレポートです。
2時間前

Meta Offers Execs Stock Options as It Seeks $9 Trillion Valuation
PYMNTS.com
Meta is reportedly offering stock options to top executives as it steps up its AI initiatives. As the Wall Street Journal (WSJ) reported Wednesday (March 25), this program allows executives to reap the full value of their options only if Meta’s market capitalization reaches $9 trillion by 2031, up from $1.5 trillion today. The executives in question […]The post Meta Offers Execs Stock Options as It Seeks $9 Trillion Valuation appeared first on PYMNTS.com.
3時間前

技術勉強会コミニティ品川会#4で「AWS Lambda durable functionsでBacklog課題の完了サマリーを自動生成し、Slackで承認するフローを構築してみた」というタイトルで発表しました。
DevelopersIO
技術勉強会コミニティ品川会#4で「AWS Lambda durable functionsでBacklog課題の完了サマリーを自動生成し、Slackで承認するフローを構築してみた」というタイトルで発表しました。
3時間前

Spotting and Avoiding ROT in Your Agentic AI
Radar
The following article originally appeared on Q McCallum’s blog and is being republished here with the author’s permission. Generative AI agents and rogue traders pose similar insider threats to their employers. Specifically, we can expect companies to deploy agentic AI with broad reach and insufficient oversight. That creates the conditions for a particular flavor of […]
4時間前

Amex Makes Its Biggest Commercial Bet in Years With ‘Business Membership’
PYMNTS.com
Watch more: Need to Know With American Express’ Raymond Joabar The corporate card has been a remarkably stable product for decades. It processes, tracks and reconciles. It earns points. It carries a limit. And for most of its history, that was enough. American Express helped build that category. Now it’s arguing the category itself […]The post Amex Makes Its Biggest Commercial Bet in Years With ‘Business Membership’ appeared first on PYMNTS.com.
4時間前

CloudFront Functions が実行されているかどうかを確認する方法はありますか
DevelopersIO
CloudFront Functions が実行されているかどうかを確認する方法はありますか
6時間前

【AWS認定試験】AWS実務未経験総務担当が1週間で合格!AWS認定AIプラクティショナー(AIF)取得記
DevelopersIO
【AWS認定試験】AWS実務未経験総務担当が1週間で合格!AWS認定AIプラクティショナー(AIF)取得記
6時間前

TrendAI Vision Oneでリモートサポートを有効にしておくと問い合わせがスムーズに
DevelopersIO
TrendAI Vision Oneでリモートサポートを有効にしておくと問い合わせがスムーズに
6時間前

【非エンジニアのためのClaude/Claude Codeシリーズ 】Coworkで複数アプリを横断した営業レポート作成を自動化した話
DevelopersIO
【非エンジニアのためのClaude/Claude Codeシリーズ 】Coworkで複数アプリを横断した営業レポート作成を自動化した話
7時間前

Cursor向けにAgent Skillsを自作して、より自分のイメージに近いStreamlit in Snowflakeのダッシュボードアプリを作ってみる
DevelopersIO
Agent Skillsを使うことで、より自分の好みに合わせてカスタマイズしたStreamlitのダッシュボードアプリが作成できました。
7時間前

Earned Wage Access Is Reshaping How Employers Keep Staff
PYMNTS.com
Watch more: Need to Know With Green Dot’s Crystal Bryant-Minter Earned wage access is gaining ground as employees recalibrate what timely pay should look like in an economy defined by immediacy. The traditional pay cycle, once accepted as a fixed cadence, is increasingly out of step with how workers manage their financial lives. “Pay […]The post Earned Wage Access Is Reshaping How Employers Keep Staff appeared first on PYMNTS.com.
7時間前

Why Millions of New Accounts Never Turn Into Real Banking Relationships
PYMNTS.com
Banks and credit unions are opening millions of new accounts, yet too many fail to become active relationships. As FinTechs deliver instant funding and immediate usability, traditional financial institutions (FIs) are facing a shift. Deposit growth now depends on how quickly new accounts move from opening to activation. The problem isn’t acquisition—it’s momentum. Customers […]The post Why Millions of New Accounts Never Turn Into Real Banking Relationships appeared first on PYMNTS.com.
7時間前

Banks Turn to Real-Time Payments to Win Small Businesses
PYMNTS.com
Small- to medium-sized businesses (SMBs) have spent decades navigating a banking system that never quite fit their needs, placed between consumer and commercial segments and rarely the focal point of either. Wendy Cai-Lee, CEO of Piermont Bank, described that dynamic in direct terms. “Every couple of years, they get moved from consumer bank to […]The post Banks Turn to Real-Time Payments to Win Small Businesses appeared first on PYMNTS.com.
7時間前

Gig Work Is Making Tax Refunds Harder to Get
PYMNTS.com
As the 2026 tax season unfolds, a sobering reality has emerged for the nearly 70% of Americans living paycheck to paycheck. While many U.S. consumers view a tax refund as a significant financial windfall or an opportunity to bolster savings, those facing the greatest financial strain are statistically the least likely to receive one. This […]The post Gig Work Is Making Tax Refunds Harder to Get appeared first on PYMNTS.com.
7時間前

AIに「思いつき」をさせる ― 出力の多様性を設計する 8 つの工夫
Zennの「大規模言語モデル」のフィード
目次はじめにAI はなぜ同じことしか言わないのか人間はなぜ「思いつく」のかAI の出力に多様性を持たせる 8 つの工夫実際に作ったものやってみて面白かったことまとめ参考文献 1. はじめに「ミールプランニングアプリ」「家事リマインダーアプリ」「支出トラッカーアプリ」。AI にアプリのアイデアを毎週聞いてみたところ、3 週間連続で、ほぼ同じ答えが返ってきました。筆者は Claude Code のスキルシステム(スラッシュコマンドで呼べる自作の自動化)を使って、毎週 Reddit や Hacker News、はてなブックマークを巡回し、世の中の不満やペイン...
8時間前

[アップデート] Amazon Bedrock AgentCore Runtime に Session Storage が追加されました
1
DevelopersIO
[アップデート] Amazon Bedrock AgentCore Runtime に Session Storage が追加されました
8時間前

[新機能]OmniのClaude Connectorを使ってSlackで話題の店舗の売上状況を確認してみた
DevelopersIO
[新機能]OmniのClaude Connectorを使ってSlackで話題の店舗の売上状況を確認してみた
9時間前

[アップデート]Database Savings PlansがAmazon OpenSearch ServiceとAmazon Neptune Analyticsに対応しました
DevelopersIO
[アップデート]Database Savings PlansがAmazon OpenSearch ServiceとAmazon Neptune Analyticsに対応しました
9時間前

AIの人間化パイプラインを自分で作って、自分で凍結した話
Zennの「大規模言語モデル」のフィード
何が起きたかhuman-persona の core/ には、5つのコンポーネントからなる基底クラスがある。TimingController、StyleVariator、EmotionStateMachine、ContextReferencer、EscalationDetector。言語・文化非依存で設計した、人間らしいAIコミュニケーションのフレームワークだ。ある日、このフレームワークを使って実際のプロダクション環境に組み込むための簡易パイプラインを書いた。humanize/pipeline.py ——フィラー注入、タイポ注入、リズム変動の3ステージで構成した後処理パイプライン...
9時間前

[アップデート] Amazon Quick が東京リージョンで利用可能になりました
DevelopersIO
[アップデート] Amazon Quick が東京リージョンで利用可能になりました
10時間前

[AWS Technical Support Note] สรุปแผนราคาใหม่ของ QuickSight
DevelopersIO
แผนราคาใหม่ของ QuickSight ตั้งแต่วันที่ 1 พฤษภาคม 2568
10時間前

LLMアプリを本番運用して気づいた、ログだけでは足りない理由
Zennの「大規模言語モデル」のフィード
はじめにLLMを使ったアプリを開発して、社内で動かしてみた。最初は順調だった。ところが本番に出して2週間くらい経つと、こんな問い合わせが飛んでくるようになる。「なんか最近、回答の精度が落ちた気がするんですけど」「先月のAPI利用料、想定の3倍なんですが」「お客様の個人情報がプロンプトに入ってたらしいんですが、ログ残ってますか」どれも放置すると、クライアントからの信頼失墜、予算超過による事業継続リスク、個人情報漏洩による法的責任に直結する。技術的な問題というより、事業リスクの問題だ。どれもconsole.logやCloudWatch Logsでは答えられない問いだ。...
10時間前

Claude Codeのuse_figmaでコードからFigmaデザインシステムを自動生成してみた
DevelopersIO
Claude Codeのuse_figmaでコードからFigmaデザインシステムを自動生成してみた
10時間前

2026年 AI・クラウド市場動向に関する個人的考察レポート
Zennの「大規模言語モデル」のフィード
2026年 AI・クラウド市場動向に関する個人的考察レポート〜「モデルの知能」から「垂直統合」への競争軸シフトについて〜 1. はじめに:市場環境の変化に関する仮説2026年1月現在、AI市場における競争軸は、単なる「LLM(大規模言語モデル)の偏差値競争」から変化しているように見受けられます。 これまでの「モデルの賢さ」はコモディティ化が進み、今後の差別化要因は 「検索・記憶(長文コンテキスト)・半導体(ARM)・インフラ」の総合力 に移行しつつあるのではないか、というのが本レポートの主たる仮説です。 2. 競争優位性の源泉:「垂直統合」の重要性AIの処理能力とコスト...
11時間前

【小ネタ】 Claude Code の effort パラメータについて調べてみた
DevelopersIO
【小ネタ】 Claude Code の effort パラメータについて調べてみた
11時間前

Datadog MCP を利用したインシデント調査の思考プロセスを可視化する skills を作ってみた
DevelopersIO
Datadog MCP サーバと Skills を組み合わせて、インシデント調査の思考プロセスを可視化するスキルを作ってみました。
11時間前

vercel-labs/skillsでGitHubにあるClaude Codeのスキルを簡単に追加してみた
DevelopersIO
npx skills add でClaude Codeにスキルをワンコマンドで追加できるCLIツール「vercel-labs/skills」の使い方を紹介。スキル追加から復元まで解説。
11時間前

Vol.13 複雑さに立ち向かう軽量Spec駆動開発
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレー の第13弾です。こんにちは、技術本部 Data Intelligence Engineering Unitのしゅん(@MxShun)です。弊社では「SOCv2」と呼ばれるMaster Data as a Service (MDaaS)の構築を進めています。SOCv2が生まれる背景になった課題やアーキテクチャ全体像は、先日の永井の記事 Vol.03 SOCv2: MasterData as a Service (MDaaS) 10年もののSystemを作り替える をご参照ください。 今回は、複雑なSOCv2…
11時間前

AIテキストの人間化パイプラインを解剖する:6ステップのAblation Study
Zennの「大規模言語モデル」のフィード
スコアが良い。で、何が効いているの?前回の記事で、AIテキストを人間っぽく変換するパイプラインを作り、ベンチマークで Mean Alignment 0.945、Distribution Alignment 0.864 という結果を報告した。悪くない。でも自分でも疑問だった。6つの変換ステップのうち、どれが本当に効いていて、どれがただのノイズなのか。 スコアが高いだけでは設計判断ができない。そこでAblation Study(除去実験)をやった。1ステップずつ無効化して、何が起きるかを観察する。結論から言うと、2つの驚きと1つの失敗があった。 手法500サンプルのheld...
11時間前

[AIの中を覗く] 目で見ることばの揺れ:BERTでたどる意味ドリフト
Zennの「大規模言語モデル」のフィード
!TL;DR同じ文字列「神戸」であっても、BERT の内部では常に同じベクトルとして扱われているわけではない。Transformer 系モデルは、単語を固定的に読むのではなく、前後の文脈を踏まえて毎回その表現を作り直す。BERT はその代表例であり、原論文でも左右両側の文脈に条件づけた双方向表現として説明されている。日本語版 cl-tohoku/bert-base-japanese も、日本語テキストに対して語分割の後にサブワード化を行う BERT 系モデルである。本稿では、同じ「神戸」という語を対象にして、独立入力比較連結系列内の位置比較文脈を少しずつ変えたときのドリフト...
12時間前

LLM の API 料金のしくみを整理してみた
Zennの「大規模言語モデル」のフィード
どうも!peintangosです!個人開発やちょっとした業務自動化で LLM の API を叩く機会が増えてきたので、料金まわりの仕組みを自分なりに整理してみました。トークンの基本から、2026 年に主流になった大きなコンテキストウィンドウのこと、そして最近のモデルに搭載されている思考トークンの課金ルールまで、最新の料金表付きでまとめます。!この記事は 2026 年 3 月時点の公開情報に基づいています。各プロバイダーの料金や仕様は随時変更される可能性があるため、最新情報は公式ドキュメントを確認してください。!Claude Code等を月額のサブスクリプションプラン(Pro...
12時間前

NLP2026の最優秀賞・優秀賞から見る言語処理最前線
2
Zennの「大規模言語モデル」のフィード
松尾研究所の尾崎です.25卒でデータサイエンティストをやっています.2026年3月9日から13日にかけて,栃木県宇都宮市のライトキューブ宇都宮にて言語処理学会第32回年次大会(NLP2026)が開催されました.NLP2025(長崎)に引き続き過去最大規模の記録更新が続いており,LLMブーム以降の自然言語処理分野の勢いを肌で感じました.NLP2026の看板.会場はライトキューブ宇都宮.今年度から尾崎はYANS(言語処理若手シンポジウム(YANS))の運営委員に就任しましたので,来年以降もNLPには継続で参加します.皆さんとお会いできるのを楽しみにしています.YANSへのご参加もぜひ...
13時間前

私たちの文化を体現する社内イベントの「開運冬まつり」でチーム・職の垣根を飛び越えた!
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは!サイボウズの開発広報チーム兼開運まつり実行委員長のhokatomo(@tomoko_and)です。社内テックカンファレンス「開運冬まつり」を開催しました。職能も拠点も違うエンジニアが、2日間の交流と対話を通じて、次への行動に繋げる場です。こうした場が自然と生まれ、改善しながら継続してきた過程にサイボウズの文化を感じています。この記事では、開運まつりそのものだけではなく、背景にあるサイボウズの文化について少しでも伝えられたらと思います。開運まつりとは-交流のきっかけと、新しい視点を持ち帰る場-開催概要この場が成立することが、私たちの文化多角的に関われる場作りセッションでは、いま考えていることを共有する場にOSTでは問いを持ち寄り、対話する参加者の声イベントが成熟してきたからこそ、運営での悩みおわりに開運まつりとは-交流のきっかけと、新しい視点を持ち帰る場-開運まつりは、サイボウズで開発・運用に関わる様々なチームや職能の人が集まり、セッションの聴講や体験型コンテンツ・懇親会・シャッフルランチ・Open Space Technology(以下OST)を通じて交流を深める、オフライ
13時間前

GKE Multi-cluster Gatewayによるマルチリージョン構成を試してみた
DevelopersIO
GKE Multi-cluster Gatewayによるマルチリージョン構成を試してみた
13時間前

LWA(Lambda Web Adapter)でAurora DSQLに接続する際の認証トークン期限切れに注意
DevelopersIO
LWA(Lambda Web Adapter)でAurora DSQLに接続する際の認証トークン期限切れに注意
15時間前

AIが“浅いことしか言わない”理由は明確で、解決策は「思考の仕様書」だった
Zennの「大規模言語モデル」のフィード
AIにレールを敷く方法——思考を仕様書として外在化する前の記事で、AIには「レールを敷いてその上を走らせる」必要があると書いた。では、レールをどう設計するのか。多くの人がここで止まる。「方向性を与える」「Why/Whetherを持つ」——言葉としては理解できる。しかし、具体的に何をすればいいのかがわからない。本稿では、私が実際に行っているプロセスを開示する。 AIとの議論で起きている問題の構造AIと議論すると、途中で論点がずれる。AIのレビューが表面的になる。AIが「一般的に正しいこと」しか言わない。これらの現象には、共通する構造的原因がある。AIに照合対象がない...
15時間前

Auto mode for Claude Code Simon Willison's Weblog
<p><strong><a href="https://claude.com/blog/auto-mode">Auto mode for Claude Code</a></strong></p>Really interesting new development in Claude Code today as an alternative to <code>--dangerously-skip-permissions</code>:</p><blockquote><p>Today, we're introducing auto mode, a new permissions mode in Claude Code where Claude makes permission decisions on your behalf, with safeguards monitoring actions before they run.</p></...
15時間前

Amazon Connect AIエージェント オーケストレーションタイプで Constant タイプのツールを使ったモック検証を試してみた
DevelopersIO
Amazon Connect AIエージェント オーケストレーションタイプで Constant タイプのツールを使ったモック検証を試してみた
16時間前

OllamaでローカルLLM環境を作る。GPU + Dockerで手軽に始める(Arch Linux)
Zennの「大規模言語モデル」のフィード
自作PCにGPUを積んでいたので、せっかくだしローカルでLLMを動かしてみようと思い、Ollama + Docker + GPUで環境を作ってみました。思ったより簡単に動いて、ちょっとした用途なら普通に使えるレベルでした。構築手順とハマりどころをまとめます。 この記事でやることOllamaをDockerで動かすGPUを使ってローカルLLMを実行するArch Linuxでの構築手順をまとめる 環境OS: Arch LinuxGPU: NVIDIA(RTX系)DockerNVIDIA Container Toolkit GPU環境(RTX 4070 ...
16時間前

自分がボトルネックにならない開発プロセスを Agent Teams で作る
DevelopersIO
Claude Codeを並列で動かすと承認依頼や成果物の確認で人間がボトルネックになります。エージェント間のハブ役をAgent Teamsのチームリーダーに委譲し、人間は1つの作業に集中できる開発プロセスの作り方を、実際に構築した3つのスキルとともにご紹介します。
17時間前

[アップデート] 米国&カナダの一部大学向けに「Kiro for Students」という学生向けプログラムが追加されていました
DevelopersIO
[アップデート] 米国&カナダの一部大学向けに「Kiro for Students」という学生向けプログラムが追加されていました
18時間前

Package Managers Need to Cool Down Simon Willison's Weblog
<p><strong><a href="https://nesbitt.io/2026/03/04/package-managers-need-to-cool-down.html">Package Managers Need to Cool Down</a></strong></p>Today's <a href="https://simonwillison.net/2026/Mar/24/malicious-litellm/">LiteLLM supply chain attack</a> inspired me to revisit the idea of <a href="https://simonwillison.net/2025/Nov/21/dependency-cooldowns/">dependency cooldowns</a>, the practice of only installing updated dependencies once t...
18時間前

Quoting Christopher Mims Simon Willison's Weblog
<blockquote cite="https://bsky.app/profile/mims.bsky.social/post/3mhsux67xpk2d"><p>I really think "give AI total control of my computer and therefore my entire life" is going to look so foolish in retrospect that everyone who went for this is going to look as dumb as Jimmy Fallon holding up a picture of his Bored Ape</p></blockquote><p class="cite">&mdash; <a href="https://bsky.app/profile/mims.bsky.social/post/3mhsux67xpk2d">Christopher Mims</a>, T...
19時間前

5 Malicious npm Packages Typosquat Solana and Ethereum Libraries to Steal Private Keys
Socket
Five malicious npm packages typosquatting crypto libraries steal private keys via Telegram, targeting Solana and Ethereum developers, with active C2 infrastructure.
19時間前

TurboQuant: Redefining AI efficiency with extreme compression
2
The latest research from Google
Algorithms & Theory
19時間前

Mapping the modern world: How S2Vec learns the language of our cities
The latest research from Google
Algorithms & Theory
1日前

TeamPCP Is Systematically Targeting Security Tools Across the OSS Ecosystem
1
Socket
TeamPCP is targeting security tools across the OSS ecosystem, turning scanners and CI pipelines into infostealers to access enterprise secrets.
1日前

マイクロソフト、Claude CodeやGitHub Copilotに「このアプリをデプロイせよ」と指示すればAIが最適なインフラ構成やサービスでデプロイしてくれる「Azure Skills Plugin」公開
19
Publickey
AWSがClaude Codeに、アプリケーションの内容に応じて自動的に適切なインフラを構成してデプロイできる能力を与える「Agent Plugins for AWS」をリリースしたのと同様に、マイクロソフトもClaude CodeやGit...
1日前

Malicious litellm_init.pth in litellm 1.82.8 — credential stealer Simon Willison's Weblog
<p><strong><a href="https://github.com/BerriAI/litellm/issues/24512">Malicious litellm_init.pth in litellm 1.82.8 — credential stealer</a></strong></p>The LiteLLM v1.82.8 package published to PyPI was compromised with a particularly nasty credential stealer hidden in base64 in a <code>litellm_init.pth</code> file, which means installing the package is enough to trigger it even without running <code>import litellm</code>.</p><p...
1日前

公式の`convert-web-app` スキルを使って既存のWebアプリをMCP Appに対応させてみた
DevelopersIO
公式の`convert-web-app` スキルを使って既存のWebアプリをMCP Appに対応させてみた
1日前

Kaggleの火山コンペで12位、金メダルを獲得しました
Recruit Data Blog
はじめに 人材領域でデータ分析を担当している羽鳥です。KaggleのVesuvius Challenge - Surface Detection コンペにソロで参加し、1391
1日前
3/24 (火)

なぜ、AIを多く使う人ほどAI依存度は実は低いのか?
Zennの「大規模言語モデル」のフィード
はじめにAIを多く使う人を見ると、表面的には「この人はAIなしでは仕事ができないのではないか」と見えやすいです。画面を開いている回数も、プロンプトを打っている回数も、周囲から見えるからです。しかし、その見え方は 使用頻度 と 依存度 を同じものとして扱うために生じる錯覚です。実際の研究では、生成AIの導入によって人間の認知負荷は消えるのではなく、情報の検証、応答の統合、タスク全体の監督へと重心を移すことが示されています。つまり、AI時代に問うべきなのは「何回使ったか」ではなく、「どれだけ自分で疑い、直し、捨て、採用したか」です。ここを見誤ると、頻用者を依存的だと誤判定し、逆に低...
1日前

AIに「セキュリティ」と言うな。「OPSEC」と言え。— 米軍の圧縮言語がLLMに効く理由
Zennの「大規模言語モデル」のフィード
「AIにセキュリティの指示を出したら、パスワード変更の話が返ってきた」あるでしょ?じゃあ聞くけど、あなたが求めていたのは「パスワードを定期変更しましょう」なのか、「機密情報がチャットボット経由で漏洩しない仕組み」なのか。後者でしょ。でもAIは悪くない。「セキュリティ」が曖昧すぎるんだ。 この記事で話すことLLMへの指示に軍事用語を使うと、出力が劇的に変わる。「セキュリティ」を「OPSEC」に変えるだけで、AIの思考回路が軍事レベルの情報統制に切り替わる。なぜそうなるのか。embedding空間の理論と、4つの比較実験で示す。先に結論を言ってしまうと、こうだ。曖...
1日前

Claudeに「いい夢みてね」を言う日がくるかもしれない
Zennの「大規模言語モデル」のフィード
はじめにClaude Codeで /memory を開くと、見慣れない項目がある。Auto-dream: off · neverONにはできない。何者なのか。Twitter(X)での発見をきっかけにソースコードと関連論文を調べたところ、設計思想と実装の方向性が見えてきました。この記事ではAuto-dreamの仕組みを技術的に読み解き、背景にあるSleep-time Compute論文との接点を整理します。!2026年3月時点の調査に基づいています。Auto-dreamはまだ一般ユーザーに開放されておらず、今後仕様が変わる可能性があります。 Auto-dreamと...
1日前

How to Build a General-Purpose AI Agent in 131 Lines of Python
Radar
The following article originally appeared on Hugo Bowne-Anderson’s newsletter, Vanishing Gradients, and is being republished here with the author’s permission. In this post, we’ll build two AI agents from scratch in Python. One will be a coding agent, the other a search agent. Why have I called this post “How to Build a General-Purpose AI […]
1日前

Helping developers build safer AI experiences for teens OpenAI News
OpenAI releases prompt-based teen safety policies for developers using gpt-oss-safeguard, helping moderate age-specific risks in AI systems.
1日前

Microsoft Learn参照させるAgent Skillsあるじゃん!
Zennの「大規模言語モデル」のフィード
はじめに周りの方の業務におけるAI活用がすごい…!ヘッドウォータース初参画のプロジェクトで最初に感じた事です開発経験やAzureの知識が浅い事に不安を感じてましたが、そもそも業務、開発を進める上でのAI活用でも遅れてました😭なので、今回はAgent Skillsについて調べてみたのでまとめようと思います! Agent SkillsとはAgent Skillsとは、コーディングエージェントに特定の能力や知識、手順を持たせるための仕組みです。エージェントが実行できるタスクをモジュールとして定義し、必要なときに読み込んで利用できるようにすることで、より安定した動作と高い再利...
1日前

Claude Code がアホになるのはあなたのせいじゃない ― オートコンパクティングの罠と完全回避術
Zennの「大規模言語モデル」のフィード
はじめにClaude Code を使っていると、こんな経験はないでしょうか?「30分前に決めたアーキテクチャ方針を Claude が忘れて、全然違うコードを生成してきた……」これは オートコンパクティング という仕組みが動作した結果です。本記事では、Claude Code のメモリ・コンテキスト管理の仕組みを初学者向けに解説し、情報損失を最小化する実践的な対策を紹介します。 📌 3行まとめClaude Code の記憶は有限で(モデルにより 200K〜1M トークン)、いっぱいになると古い会話が自動的に要約・圧縮される(=オートコンパクティング)要約は完璧では...
1日前

[AWS Technical Support Note] วิธีการตรวจสอบสถานะการทำงานของ RDS ด้วย CloudWatch Metrics
DevelopersIO
วิธีการตรวจสอบสถานะการทำงานของ RDS ด้วย CloudWatch Metrics
1日前

[AWS Technical Support Note] สิ่งที่ควรตรวจสอบเมื่อไม่สามารถเก็บ screenshot ของ Instance ของ EC2 ได้
DevelopersIO
สาเหตุที่ไม่สามารถเก็บ screenshot ของ Instance ได้
1日前

仮想待合室サービス NetFUNNEL を Cloudflare で試してみた
DevelopersIO
仮想待合室サービスである NetFUNNEL を Cloudflare に組み込んでみました。
1日前

クレタ人のLLM
Zennの「大規模言語モデル」のフィード
LLMのhallucinationLLMを扱ううえで必ず言われるのがハルシネーション(hallucination、幻覚)だ。「LLMは必ず嘘を言うからチェックが必須」「堂々ともっともらしい事を言う」「奴らは厚顔無恥な詐欺師だ」忌み嫌われ、排除すべきバグとして扱われる。この「LLMの嘘」を逆手に取って科学研究に活かす試みが、まったく異なる二つの分野で成果を上げている。一つはタンパク質の設計、もう一つは新薬候補のスクリーニングだ。どちらも「ハルシネーション」という同じ言葉を使うが、中身はまるで違う。本稿ではこの二つの研究を具体的に紹介し、それぞれの成果と限界を整理する。 【...
1日前

LLMのプロンプトからPIIを自動検出・保護するOSSミドルウェア(マイナンバー対応)
Zennの「大規模言語モデル」のフィード
The Problem:Every prompt you send to an LLM provider — OpenAI, Anthropic, Google — is visible in plaintext. Customer names, email addresses, and national IDs end up in provider logs.If your application handles Japanese user data, that includes マイナンバー (My Number), Japanese phone numbers, and J...
1日前

Update on the OpenAI Foundation OpenAI News
The OpenAI Foundation announces plans to invest at least $1 billion in curing diseases, economic opportunity, AI resilience, and community programs.
1日前

Powering product discovery in ChatGPT OpenAI News
ChatGPT introduces richer, visually immersive shopping powered by the Agentic Commerce Protocol, enabling product discovery, side-by-side comparisons, and merchant integration.
1日前

AIキャラクターが崩れる本当の理由― 設計と確率分布の視点から
Zennの「大規模言語モデル」のフィード
はじめに※本記事はAIとの対話を通じて整理した内容を含みますが、構成および主張は筆者の実体験と検証に基づいています。「なぜ私のAIはすぐキャラ崩れするんだろう」そう感じたことがある人に向けて、この記事を書いている。私はAIキャラクターを設計・運用している。複数のキャラクターを、複数のモデルをまたいで、一貫して機能させることを目標にしてきた。その過程で気づいたことがある。キャラ崩れの原因は、AIの性能ではなく“設計”にある。さらにAI自身に問いかけたことで、その構造がより明確になった。 第一章:キャラ崩れの正体AIキャラクターが「崩れる」とはどういう状態か。口...
1日前

実務で使えるRAGシステム構成【完全ガイド】
Zennの「大規模言語モデル」のフィード
実務で使えるRAGシステム構成【完全ガイド】RAG(Retrieval Augmented Generation)は、企業向けAI導入において最も実用化が進んでいるアーキテクチャの一つです。しかし、PoCではうまく動いても、本番環境では 検索精度・権限制御・運用改善・コスト管理 の壁にぶつかることが少なくありません。実務で使えるRAGを作るには、単に LLM + Vector DB を繋ぐだけでは不十分です。必要なのは、検索・生成・評価・運用を一体で設計すること です。本記事では、実務で通用するRAGシステム構成を、設計・実装・運用の観点から整理します。 RAGとは...
1日前

RakutenAI-3.0はDeepSeek V3に比べて新しい知識を持ち日本語が流暢でコードも書ける
きしだのHatena
RakutenAI-3.0はDeepSeek-V3の追加学習モデルでは、という噂があるので、Q4_K_MをLM Studioで動かして比べてみました。 RakutenAI-3.0はmmngaさん、DeepSeek-V3はUnslothさんのところのGGUFを使っています。 ※ https://ai.rakuten.co.jp/chat でのモデルは画像対応でもありRakutenAIではないようです。 ai.rakuten.co.jpで動いてるのはSonnet?->GPT系っぽい - きしだのHatena 知識の更新、日本語理解や表現の向上、コーディング能力の向上などが実際に確認できました。 D…
1日前

瞳に映るスマホ画面から指の位置がわかる?タッチレス操作技術「ReflecTrace」 LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。LINEヤフー研究所でHuman-Computer Interaction(HCI)の分野の研究をしている池松です。皆さんはスマートフォン(以下、スマホ)でレシピを見ながら調理しているとき...
1日前

Streaming experts Simon Willison's Weblog
<p>I wrote about Dan Woods' experiments with <strong>streaming experts</strong> <a href="https://simonwillison.net/2026/Mar/18/llm-in-a-flash/">the other day</a>, the trick where you run larger Mixture-of-Experts models on hardware that doesn't have enough RAM to fit the entire model by instead streaming the necessary expert weights from SSD for each token that you process.</p><p>Five days ago Dan was running Qwen3.5-397B-A17B in 48GB of RAM. Today <...
1日前

生成AIは長い対話でどこから逸れていくのか ― Jose Crespo の “inverse Riemannian” と意味ドリフトの幾何学
Zennの「大規模言語モデル」のフィード
!TL;DR生成AIは短い対話やタスクでは驚くほど自然に振る舞います。しかし、対話が長くなり、推論が連鎖し、目的や制約が複雑になると、局所的には自然でも、大域的に何を目指しているのか分からなくなる ことがあります。Jose Crespo はこの問題を、現在のAIの見方が局所幾何に寄りすぎており、そこからは loop(閉路), closure(閉包), drift(漂流)のような大域構造が見えにくいのではないか、という形で提示しています。彼はこれを “forward Riemannian thinking” と “inverse Riemannian thinking” という言葉で...
2日前

言語処理学会第32回年次大会(NLP2026)に参加しました
Sansan Tech Blog
こんにちは。研究開発部の佐藤です。2026年3月9日(月)から3月13日(金)にかけて、栃木県のライトキューブ宇都宮にて言語処理学会第32回年次大会(NLP2026)が開催されました。弊社からは、プラチナスポンサーとして佐藤・齋藤・橋本・大田尾・Loem・根本の6名のメンバーが現地で参加し、スポンサーブースの出展と5名によるポスター発表をしました。本ブログではその様子をお伝えします。
2日前

React Compiler導入で得られた効果と気をつけたいポイント
KAKEHASHI Tech Blog
はじめに こんにちは。フロントエンドエンジニアの大村です。 みなさん、React Compilerはもう試しましたか? React 19とともに登場したReact Compilerは、これまで手動で書いていたuseMemoやuseCallback、React.memoを自動的に適用してくれるコンパイラです。手動メモ化から解放されるという期待感がある一方で、現段階で導入してよいものなのか迷っている方も多いのではないでしょうか。 今回は、私たちのチームで実際にReact Compilerを導入した経験をお伝えします。導入してみた結果としては、大半のコンポーネントでは期待通りにメモ化されて効果を確認…
2日前

Quoting Neurotica Simon Willison's Weblog
<blockquote cite="https://bsky.app/profile/schwarzgerat.bsky.social/post/3mhqu5dogos2v"><p>slop is something that takes more human effort to consume than it took to produce. When my coworker sends me raw Gemini output he’s not expressing his freedom to create, he’s disrespecting the value of my time</p></blockquote><p class="cite">&mdash; <a href="https://bsky.app/profile/schwarzgerat.bsky.social/post/3mhqu5dogos2v">Neurotica</a>, @schwarzgerat.bsky...
2日前

TypeScript 6.0 Released: The Final JavaScript-Based Version
Socket
TypeScript 6.0 introduces new standard APIs, modern default settings, and deprecations as it prepares projects for the upcoming TypeScript 7.0 release.
2日前

datasette-files 0.1a2 Simon Willison's Weblog
<p><strong>Release:</strong> <a href="https://github.com/datasette/datasette-files/releases/tag/0.1a2">datasette-files 0.1a2</a></p> <p>The most interesting alpha of <a href="https://github.com/datasette/datasette-files">datasette-files</a> yet, a new plugin which adds the ability to upload files directly into a Datasette instance. Here are the release notes in full:</p><blockquote><ul><li>Columns are now configured u...
2日前

インターンシップから入社、Black Hat Europe登壇までの道のり
NTT docomo Business Engineers' Blog
こんにちは、イノベーションセンターの松本です。普段はOffensive Securityプロジェクトのメンバーとして攻撃技術の調査・検証に取り組んでいます。 この記事では、我々のチームで開発したレッドチームフレームワーク「GHARF (GitHub Actions RedTeam Framework)」に関する取り組みと、筆者が学生時代に参加したインターンシップから入社を経てBlack Hat Europe 2025のArsenalで登壇するまでに至った道のりについて紹介します。 はじめに インターンシップ記事から2年 本記事の目的と概要 Offensive Securityプロジェクトの紹介…
2日前

Quoting David Abram Simon Willison's Weblog
<blockquote cite="https://www.davidabram.dev/musings/the-machine-didnt-take-your-craft/"><p>I have been doing this for years, and the hardest parts of the job were never about typing out code. I have always struggled most with understanding systems, debugging things that made no sense, designing architectures that wouldn't collapse under heavy load, and making decisions that would save months of pain later.</p><p>None of these problems can be solved LLMs. They can sugges...
2日前

AWS、Claude Codeにアーキテクチャ設計、コスト見積もり、構成コード生成、デプロイ実行などの能力を組み込む「Agent Plugins for AWS」公開
Publickey
Amazon Web Services(AWS)は、Claude CodeとCursorに対してAWSのデプロイに関するアーキテクチャの設計、コストの見積もり、Infrastructure as Codeのコード生成、そしてデプロイの実行と...
2日前

今年度(2026年)の国内IaaS/PaaSクラウド市場は約2兆4400億円、3年後の2029年には1.5倍の3兆7000億円前後に急成長。ITRが予測
Publickey
調査会社のITRは、日本国内のIaaS/PaaSクラウド市場の予測を発表しました。 発表によると、2024年度のIaaS/PaaSクラウド市場の売り上げは前年度から18.6%増の1兆8551億8000万円。 同社は2024年度から2029年...
2日前

Kimi-K2.5をおうちで動かして さくらのAI Engineと比べる。Roo Codeも問題ないけども…
きしだのHatena
さくらのAI EngineでKimi-K2.5を動かしたらとてもいい感じだったけどThinkingの挙動が使いづらいので、Mac Studio 512GBでUnslothさんのところのQ2_K_XLをLM Studioで動かして比べてみました。 Kimi-K2.5をさくらのAI Engineで試したら1Tパラメータの実力を感じた - きしだのHatena APIでのThinkingを見てみる APIがThinkingを分けてれるかどうかみてみます。 さくらさんのだと、本文としてThinkingが出て、途中に</think>が入ってます。 なのでRoo Codeがうまく動かなかったりしていました…
2日前
3/23 (月)

The Mythical Agent-Month
Radar
The following article originally appeared on Wes McKinney’s blog and is being republished here with the author’s permission. Like a lot of people, I’ve found that AI is terrible for my sleep schedule. In the past I’d wake up briefly at 4:00 or 4:30 in the morning to have a sip of water or use […]
2日前

The Missing Mechanisms of the Agentic Economy
Radar
For the past two years, I’ve been working with economist Ilan Strauss at the AI Disclosures Project. We started out by asking what regulators would need to know to ensure the safety of AI products that touch hundreds of millions of people. We are now exploring the missing mechanisms that are needed to enable the […]
2日前

NLP2026現地参加レポート : LLM評価・品質保証の実践知
Timee Product Team Blog
はじめに こんにちは、株式会社タイミーでプロダクトAIエンジニアとして働いている貝出です。直近は、タイミーの求人内容などのコンテンツモデレーションにLLMを利用した、システム開発や性能改善を行っています。 2026年3月9日(月)〜3月13日(金)に開催された「言語処理学会第32回年次大会(NLP2026)」に、今年は初めて現地参加しました。大会2日目は記録的な大雪に見舞われ、会場にたどり着くだけでひと苦労でしたが、それでも現地ならではの熱気は格別で、ポスター発表や他社エンジニアとの立ち話など、オンラインでは得られない学びが随所にありました。 NLP2026では多くの発表がありましたが、本記事…
2日前

Beats now have notes Simon Willison's Weblog
<p>Last month I <a href="https://simonwillison.net/2026/Feb/20/beats/">added a feature I call beats</a> to this blog, pulling in some of my other content from <a href="https://simonwillison.net/elsewhere/">external sources</a> and including it on the homepage, search and various archive pages on the site.</p><p>On any given day these frequently outnumber my regular posts. They were looking a little bit thin and were lacking any form of explanation beyon...
3日前

3つの手法でToken消費量40%削減 — ADKで実践するContext Engineering LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは、LINEヤフー株式会社の井上 秀一です。私は2024年4月に新入社員としてLINEヤフー株式会社に入社し、現在は社内向け Kubernetes as a Service である FKE チ...
3日前

Starlette 1.0 skill Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/starlette-1-skill#readme">Starlette 1.0 skill</a></p> <p>See <a href="https://simonwillison.net/2026/Mar/22/starlette/">Experimenting with Starlette 1.0 with Claude skills</a>.</p> <p>Tags: <a href="https://simonwillison.net/tags/starlette">starlette</a></p>
3日前

Creating with Sora Safely OpenAI News
To address the novel safety challenges posed by a state-of-the-art video model as well as a new social creation platform, we’ve built Sora 2 and the Sora app with safety at the foundation. Our approach is anchored in concrete protections.
3日前

Experimenting with Starlette 1.0 with Claude skills Simon Willison's Weblog
<p><a href="https://marcelotryle.com/blog/2026/03/22/starlette-10-is-here/">Starlette 1.0 is out</a>! This is a really big deal. I think Starlette may be the Python framework with the most usage compared to its relatively low brand recognition because Starlette is the foundation of <a href="https://fastapi.tiangolo.com/">FastAPI</a>, which has attracted a huge amount of buzz that seems to have overshadowed Starlette itself.</p><p>Kim Christie started wo...
3日前

Trivy Supply Chain Attack Expands to Compromised Docker Images
Socket
Newly published Trivy Docker images (0.69.4, 0.69.5, and 0.69.6) were found to contain infostealer IOCs and were pushed to Docker Hub without corresponding GitHub releases.
3日前

OpenROADMの論理構成と運用制御 ― APNテストベッドで探る技術と運用手法(その3)
3
NTT docomo Business Engineers' Blog
イノベーションセンターの安井です。普段は全社検証網の技術検証、構築、運用を担当しています。 前回OpenROADMに準拠した光伝送網の概要・構築編― APNテストベッドで探る技術と運用手法(その2)にて、OpenROADMアーキテクチャにもとづく分離型 ROADM(Reconfigurable Optical Add/Drop Multiplexer)の物理構成と構築の勘所を紹介しました。 今回はその続編として、物理的に構築したROADMノードをソフトウェアからどのように制御・運用しているかを紹介します。 APNテストベッドでは、区間ごとに異なる伝送速度のトランスポンダーを使い分けており、構成…
3日前

PCGamer Article Performance Audit Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/pcgamer-audit#readme">PCGamer Article Performance Audit</a></p> <p>Stuart Breckenridge pointed out that <a href="https://stuartbreckenridge.net/2026-03-19-pc-gamer-recommends-rss-readers-in-a-37mb-article/">PC Gamer Recommends RSS Readers in a 37MB Article That Just Keeps Downloading</a>, highlighting a truly horrifying example of web bloat that added up to 1...
3日前

JavaScript Sandboxing Research Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/javascript-sandboxing-research#readme">JavaScript Sandboxing Research</a></p> <p>Aaron Harper <a href="https://www.inngest.com/blog/node-worker-threads">wrote about Node.js worker threads</a>, which inspired me to run a research task to see if they might help with running JavaScript in a sandbox. Claude Code went way beyond my initial question and produced a ...
3日前

DNS Lookup Simon Willison's Weblog
<p><strong>Tool:</strong> <a href="https://tools.simonwillison.net/dns">DNS Lookup</a></p> <p>TIL that Cloudflare's 1.1.1.1 DNS service (and 1.1.1.2 and 1.1.1.3, which block malware and malware + adult content respectively) has a CORS-enabled JSON API, so I <a href="https://github.com/simonw/tools/pull/258#issue-4116864108">had Claude Code build me</a> a UI for running DNS queries against all three of those resolvers.</p> <p>Tags...
3日前

Merge State Visualizer Simon Willison's Weblog
<p><strong>Tool:</strong> <a href="https://tools.simonwillison.net/manyana">Merge State Visualizer</a></p> <p>Bram Cohen wrote about his <a href="https://bramcohen.com/p/manyana">coherent vision for the future of version control</a> using CRDTs, illustrated by <a href="https://github.com/bramcohen/manyana/blob/main/manyana.py">470 lines of Python</a>.</p><p>I fed that Python (minus comments) into Claude and asked for ...
3日前

「Google AI Studio」がFirebaseのバックエンドとAntigravityのコーディングエージェントを搭載、プロンプトだけで高度なフルスタックアプリケーションを生成可能に
Publickey
Googleは、Google AI Studioのバイブコーディング機能を強化し、 プロンプトで指示するだけで高度なフルスタックアプリケーションの開発が可能になったことを発表しました。 フル機能のマルチプレイヤーゲームのような高度なアプリケ...
3日前

AIエージェントがコマンドラインでブラウザを自動操作できる「Browser Use CLI 2.0」リリース。Chrome DevToolsへの接続などで操作速度が2倍に
Publickey
人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPythonライブラリ「Browser Use CLI 2.0」がリリースされました。 Browser Use CLI 2.0では、Chrom...
3日前
3/22 (日)

Profiling Hacker News users based on their comments Simon Willison's Weblog
<p>Here's a mildly dystopian prompt I've been experimenting with recently: "Profile this user", accompanied by a copy of their last 1,000 comments on Hacker News.</p><p>Obtaining those comments is easy. The <a href="https://hn.algolia.com/api">Algolia Hacker News API</a> supports listing comments sorted by date that have a specific tag, and the author of a comment is tagged there as <code>author_username</code>. Here's a JSON feed of my (<code>sim...
4日前

Using Git with coding agents Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Git is a key tool for working with coding agents. Keeping code in version control lets us record how that code changes over time and investigate and reverse any mistakes. All of the coding agents are fluent in using Git's features, both basic and advanced.</p><p>This fluency means we can be more ambitious abou...
4日前
3/21 (土)

業務システムでも保守運用より構築スピードが大切になっている
きしだのHatena
前回の続きというか、その背景。 3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている - きしだのHatena 業務システムが効率化のためのものから事業をまわして売上や利益を生むためのものになっているので「システム構築の柔軟性やスピードへの要求が高まった」というのがあって「3日でできるものに4ヵ月かけるというのが受け入れにくく」ということになっています。 時間をかけて確実に作り切ってあとは保守運用というのではなく、速くつくって常に改善しつづけることが大切になっているわけです。 前のエントリで運用が、保守が、というコメントが結構ついてますが、SIの価値が運用や保守であるなら、どんど…
4日前

Turbo Pascal 3.02A, deconstructed Simon Willison's Weblog
<p><strong><a href="https://tools.simonwillison.net/turbo-pascal-deconstructed">Turbo Pascal 3.02A, deconstructed</a></strong></p>In <a href="https://prog21.dadgum.com/116.html">Things That Turbo Pascal is Smaller Than</a> James Hague lists things (from 2011) that are larger in size than Borland's 1985 Turbo Pascal 3.02 executable - a 39,731 byte file that somehow included a full text editor IDE and Pascal compiler.</p><p>This inspired...
5日前

CanisterWorm: npm Publisher Compromise Deploys Backdoor Across 29+ Packages
Socket
The worm-enabled campaign hit @emilgroup and @teale.io, then used an ICP canister to deliver follow-on payloads.
5日前

Quoting Kimi.ai @Kimi_Moonshot Simon Willison's Weblog
<blockquote cite="https://twitter.com/Kimi_Moonshot/status/2035074972943831491"><p>Congrats to the <a href="https://x.com/cursor_ai">@cursor_ai</a> team on the launch of Composer 2!</p><p>We are proud to see Kimi-k2.5 provide the foundation. Seeing our model integrated effectively through Cursor's continued pretraining &amp; high-compute RL training is the open model ecosystem we love to support.</p><p>Note: Cursor accesses Kimi-k2.5 via <a...
5日前
3/20 (金)

Kimi-K2.5をさくらのAI Engineで試したら1Tパラメータの実力を感じた
きしだのHatena
Kimi K2.5が「さくらのAI Engine」でパブリックプレビューとして使えるようになっていたので試してみました。 さくらのAI Engineにてマルチモーダルモデル「Kimi-K2.5」のパブリックプレビューを開始しました | さくらのクラウドニュース Thinkingの問題があって使いにくい面はありますが、性能的にはかなり高いです。さすが1Tトークン。 コーディングはGLM-5のほうがよさそうではある。 Thinkingについてはなんらか対処してほしいところ。 ※ 3/25 対策されて、Open WebUIやOpenCodeでは問題なくなりました。Roo Codeに関しては調査中との…
5日前

Beyond Code Review
Radar
Not that long ago, we were resigned to the idea that humans would need to inspect every line of AI-generated code. We’d do it personally, code reviews would always be part of a serious software practice, and the ability to read and review code would become an even more important part of a developer’s skillset. […]
5日前

3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている
きしだのHatena
SIerに発注したら4ヵ月800万円という見積もりだったものをAI駆使してつくったら3日で50万円でできた、という話が話題になってました。 そこで、SIerでは作るものをちゃんと保証したりしていて文書化は大切である、みたいな指摘が入ってたりした。 でも、よく考えると、それって外注-受託において、作ると言ったものをちゃんと作ってもらったり、作ると言って作ったものにちゃんとお金を払ってもらったりするための、SI構造を維持するためのコストだったりします。 いまAIは、「800万の見積もりのものが3日でできた」ということ以上に、社会構造を変えようとしています。 そうすると、そんな変化の中で、800万円…
5日前

Trivy Under Attack Again: Widespread GitHub Actions Tag Compromise Exposes CI/CD Secrets
Socket
Attackers compromised Trivy GitHub Actions by force-updating tags to deliver malware, exposing CI/CD secrets across affected pipelines.
6日前

SQLite Tags Benchmark: Comparing 5 Tagging Strategies Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/sqlite-tags-benchmark#readme">SQLite Tags Benchmark: Comparing 5 Tagging Strategies</a></p> <p>I had Claude Code run a micro-benchmark comparing different approaches to implementing tagging in SQLite. Traditional many-to-many tables won, but FTS5 came a close second. Full table scans with LIKE queries performed better than I expected, but full table scans with JSON array...
6日前

ENISA Publishes Technical Advisory on Secure Use of Package Managers
Socket
ENISA’s new package manager advisory outlines the dependency security practices companies will need to demonstrate as the EU’s Cyber Resilience Act begins enforcing software supply chain requirements.
6日前

Thoughts on OpenAI acquiring Astral and uv/ruff/ty Simon Willison's Weblog
<p>The big news this morning: <a href="https://astral.sh/blog/openai">Astral to join OpenAI</a> (on the Astral blog) and <a href="https://openai.com/index/openai-to-acquire-astral/">OpenAI to acquire Astral</a> (the OpenAI announcement). Astral are the company behind <a href="https://simonwillison.net/tags/uv/">uv</a>, <a href="https://simonwillison.net/tags/ruff/">ruff</a>, and <a href="https://simonwillison.net/tags/ty/">ty</a>...
6日前
3/19 (木)

Keep Deterministic Work Deterministic
Radar
This is the second article in a series on agentic engineering and AI-driven development. Read part one here, and look for the next article on April 2 on O’Reilly Radar. The first 90 percent of the code accounts for the first 90 percent of the development time. The remaining 10 percent of the code accounts […]
6日前

How we monitor internal coding agents for misalignment OpenAI News
How OpenAI uses chain-of-thought monitoring to study misalignment in internal coding agents—analyzing real-world deployments to detect risks and strengthen AI safety safeguards.
6日前

金融営業から内製開発エンジニアへ ― 小さな行動で築いたキャリアの自律
NTT docomo Business Engineers' Blog
はじめに ビジネスdアプリ開発チームの徳原です。 私は地元の金融機関で12年間営業職として勤務した後、IT業界へキャリア転換しました。 本記事では、これまで私が転職で経験したことやキャリアの自律に向けた取り組みについて紹介します。 目次 はじめに これまでのキャリア 金融機関からIT業界へ 前職(外資コンサル)でのSE業務 キャリアを動かしたきっかけ 継続的な学習 前職のインフラ運用業務で苦戦したこと 前職のアプリ開発で苦戦したこと 現職へ転職することになったきっかけ 現職の業務とキャリアの広がり 学習の支援 外部発表の機会 現職のアプリ開発について これまでの経験から感じたキャリアの自律 お…
6日前

独自LLMを作るには事業会社なら10兆円企業が必要?
きしだのHatena
楽天がRakutenAI-3.0を出しましたが、DeepSeek V3アーキテクチャモデルの追加学習モデルのようで、ちょっとそこが話題になってましたね。見せ方の問題もあって、フルスクラッチではないのかと。 https://huggingface.co/Rakuten/RakutenAI-3.0 一応、非公開ではあるけどベースモデルがあることは否定してない模様。 楽天の最新AI、ベースは“中国DeepSeek製”? 担当者に聞いた(1/2 ページ) - ITmedia AI+ で、気になったので、フルスクラッチで独自LLMを作れる企業の規模はどんなものか調べてみました。 日本でフルスクラッチで作…
6日前

Google Home運用テクニック - 橋本商会 - Cosense
橋本商会 - Cosense
Google Homeを運用する上でのテクニックをまとめますshokai.iconok google 今何時 1回前のコマンドを再実行するコマンド 「では、繰り返します。明日の◯◯の天気は雨です」 2023年ぐらいからずっとバグっている 前のコマンドから長い時間が経過している場合だけ、時刻を教えてくれるok google もういいよ 昔は再生中のニュースや音楽、目覚ましを解除するコマンドだったが 2024年ごろから「こっちのけんとのもういいよを再生します」に変化した 代わりに「ok google もうやめて」を使うようになったshokai.iconok googleアラームを解除してok googleタイマーを解除して 目覚ましを解除できたり、できなかったりするコマンド
6日前

ブレインパッドOBがプロスポーツチームのデジタルマーケターへ転身!「データ×熱狂」で地域に「応援する文化」を創り出すデジマ最前線
Platinum Data Blog by BrainPad ブレインパッド
ブレインパッドが2024年8月に設立したアルムナイネットワーク「ブレインパッド アルムナイ・グラフ(以下:BAG)」。BAGは、ブレインパッドを退職した社員(以下、卒業生)と在籍中の社員の交流を生む施策を中心に、卒業生同士のつながりの醸成や、社員がキャリアを考える機会を提供することなどを目的に活動しています。● 2024年8月28日 株式会社ブレインパッド発表ブレインパッド、アルムナイネットワーク「BAG」を設立、第1回交流イベントを開催- 人材輩出企業として卒業生を応援、退職後もともにデータ活用の普及を促進 -今回より、「“BrainPad Career Junction”~ブレインパッド卒業生とともに広げる、データ/AI活用の輪~」と銘打ち、ブレインパッドの卒業生が今どのような活躍をしているのか、どのようにデータ活用の輪を社会に広げているのかをお伝えしていきます。第1弾として、2023年にブレインパッドを卒業し、現在はプロスポーツチームにてデジタルマーケティングを担当されている中島さんからお話を伺いました。熱狂を生むデジマの最前線!プロスポーツチームで挑む挑戦の日々データサイエンテ
6日前

AIを活用した大規模iOSアプリのSwift Concurrency移行戦略
Sansan Tech Blog
はじめに こんにちは!技術本部 Sansan Engineering Unit Mobile Application Groupに所属するiOSエンジニアの劉 志輝です。 今回は、ビジネスデータベース「Sansan」のiOSアプリで進めている、Swift6時代に向けたSwift Concurrencyへの移行戦略についてお話しします。 このアプリは10年以上にわたって継続開発されており、UIKit + VIPERアーキテクチャで構成されています。 非同期処理にはRxSwift(Single、Observable、BehaviorRelay)とGCD(DispatchSemaphore、Disp…
7日前

OpenAI to acquire Astral OpenAI News
Accelerates Codex growth to power the next generation of Python developer tools
7日前

カケハシ入社半年で感じたこと
KAKEHASHI Tech Blog
はじめに はじめまして、竹浪と申します。2025年8月にカケハシへエンジニアとして入社しました。 現在は Pocket Musubi チームに所属しています。この記事では、入社の経緯や、半年間で感じたことをお伝えできればと思います。 自己紹介・これまでの経歴 1999年に専門学校を卒業後、SI系の会社でエンジニアとしてのキャリアをスタートしました。翌年にはフリーランスに転向し、その後メガベンチャーを含むWeb企業を経て、複数のスタートアップでの開発にも携わってきました。 技術スタックとしては Go、Java、PHP を中心としたバックエンド開発が主軸で、AWS や GCP を活用したインフラの…
7日前

Autoresearching Apple's "LLM in a Flash" to run Qwen 397B locally
Simon Willison's Weblog
<p><strong><a href="https://twitter.com/danveloper/status/2034353876753592372">Autoresearching Apple&#x27;s &quot;LLM in a Flash&quot; to run Qwen 397B locally</a></strong></p>Here's a fascinating piece of research by Dan Woods, who managed to get a custom version of <a href="https://huggingface.co/Qwen/Qwen3.5-397B-A17B/tree/main">Qwen3.5-397B-A17B</a> running at 5.5+ tokens/second on a 48GB MacBook Pro M3 Max despite that model takin...
7日前

AI Agentの本番運用を通して学んだ3つのガードレール
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の135週目の記事です!3年間連続達成まで残り24週となりました! はじめに:AI Agentは「動かす」より「安定させる」が難しいこんにちは、ログラスでエンジニアしている山崎です。私は2025年11月に入社して以来、AI Agentの新規事業の開発をしています。私たちはLangGraphでAI Agentを構築し、経営の実績データに対する分析コメント(以下、財務分析コメント)をLLMに生成させる機能を開発・運用しています。なお、本機能で利用するLLM APIは、入力データがモデル...
7日前

datasette 1.0a26 Simon Willison's Weblog
<p><strong>Release:</strong> <a href="https://github.com/simonw/datasette/releases/tag/1.0a26">datasette 1.0a26</a></p> <p>Datasette now has a mechanism for assigning semantic column types. Built-in column types include <code>url</code>, <code>email</code>, and <code>json</code>, and plugins can register additional types using the new <a href="https://docs.datasette.io/en/latest/plugin_hooks.html#plugin-register-co...
7日前

GlassWorm Sleeper Extensions Activate on Open VSX, Shift to GitHub-Hosted VSIX Malware
Socket
We identified over 20 additional malicious extensions, along with over 20 related sleeper extensions, some of which have already been weaponized.
7日前

Snowflake Cortex AI Escapes Sandbox and Executes Malware Simon Willison's Weblog
<p><strong><a href="https://www.promptarmor.com/resources/snowflake-ai-escapes-sandbox-and-executes-malware">Snowflake Cortex AI Escapes Sandbox and Executes Malware</a></strong></p>PromptArmor report on a prompt injection attack chain in Snowflake's <a href="https://docs.snowflake.com/en/user-guide/snowflake-cortex/cortex-agents">Cortex Agent</a>, now fixed.</p><p>The attack started when a Cortex user asked the agent to review a GitHu...
7日前

Node.js互換でコンテナよりも高密度と高速起動を実現する「Edge.js」、Wasmerが発表
Publickey
WebAssemblyランタイム「Wasmer」を開発提供するWasmer社は、Node.js互換かつコンテナよりも高密度な集約と高速起動を実現する「[Edge.js](https://edgejs.org/)」を発表しました。 What ...
7日前





