直近1週間の更新
3/25 (水)

Can Your Company’s Data Keep Up With Enterprise AI?
PYMNTS.com
For all the urgency surrounding artificial intelligence, many companies are still in Automation 1.0. While AI as a buzzword has become shorthand for progress, inside most organizations, what is labeled “AI” is more accurately described as an extension of earlier automation technologies. Thes firms are focused on using technology to move faster, not think […]The post Can Your Company’s Data Keep Up With Enterprise AI? appeared first on PYMNTS.com.
12分前

Malicious litellm_init.pth in litellm 1.82.8 — credential stealer
Simon Willison's Weblog
<p><strong><a href="https://github.com/BerriAI/litellm/issues/24512">Malicious litellm_init.pth in litellm 1.82.8 — credential stealer</a></strong></p>The LiteLLM v1.82.8 package published to PyPI was compromised with a particularly nasty credential stealer hidden in base64 in a <code>litellm_init.pth</code> file, which means installing the package is enough to trigger it even without running <code>import litellm</code>.</p><p...
16分前

公式の`convert-web-app` スキルを使って既存のWebアプリをMCP Appに対応させてみた
DevelopersIO
公式の`convert-web-app` スキルを使って既存のWebアプリをMCP Appに対応させてみた
23分前
3/24 (火)

VSCode の GitHub Copilot で Claude Code を使う方法
DevelopersIO
VSCode の GitHub Copilot で Claude Code を使う方法
41分前

Circle and Sasai Explore USDC Stablecoin Applications Across Africa
PYMNTS.com
Circle Internet Group and Sasai Fintech, a pan-African digital payments solution provider, have partnered to explore applications for Circle’s USDC stablecoin across Africa. Sasai Fintech, a business of Cassava Technologies, operates across key payment corridors and offers a suite of digital financial services that enables business payments, cross-border transfers for individuals and remittance operators, […]The post Circle and Sasai Explore USDC Stablecoin Applications Across Africa appeared fi
1時間前

Bank of London Fined $2.6 Million for Misleading Regulators
PYMNTS.com
British regulators have fined the Bank of London for providing fabricated documents about its finances. The Prudential Regulation Authority (PRA) announced the fine of 2 million pounds ($2.6 million) against the bank and its parent company Oplyse Holdings Limited on Tuesday (March 24) for misleading the regulator about its capital position, “failing to act with integrity,” failing to maintain adequate […]The post Bank of London Fined $2.6 Million for Misleading Regulators appeared first on PYMNT
1時間前

Solana Simplifies Blockchain for Enterprises and Financial Institutions
PYMNTS.com
Solana Foundation has launched a developer platform designed to make it easy for enterprises and financial institutions to build and launch financial products on the Solana blockchain. The Solana Developer Platform (SDP) can be used out of the box by artificial intelligence coding platforms, is powered by application programming interfaces (APIs), and brings together […]The post Solana Simplifies Blockchain for Enterprises and Financial Institutions appeared first on PYMNTS.com.
2時間前

How to Build a General-Purpose AI Agent in 131 Lines of Python
Radar
The following article originally appeared on Hugo Bowne-Anderson’s newsletter, Vanishing Gradients, and is being republished here with the author’s permission. In this post, we’ll build two AI agents from scratch in Python. One will be a coding agent, the other a search agent. Why have I called this post “How to Build a General-Purpose AI […]
4時間前

Revolut Profit Hits Record $2.2 Billion as Subscriptions Surge
PYMNTS.com
UK-based FinTech Revolut says its subscription income helped drive record profits last year. The company released its annual report Tuesday (March 24) showing profits of $2.3 billion, with revenues of $6 billion, a 40% increase. It comes weeks after Revolut landed its long-awaited UK banking license, and follows a year in which the company […]The post Revolut Profit Hits Record $2.2 Billion as Subscriptions Surge appeared first on PYMNTS.com.
5時間前

FICO’s Mortgage Pricing Targeted in Senator’s Investigation
PYMNTS.com
U.S. Sen. Josh Hawley says he plans to investigate FICO’s mortgage pricing practices. The Missouri Republican announced Monday (March 26) that he was looking into the credit scoring company’s recent price hikes, and that he wants the Federal Trade Commission (FTC) to do the same. “These price increases are most damaging to the Americans […]The post FICO’s Mortgage Pricing Targeted in Senator’s Investigation appeared first on PYMNTS.com.
5時間前

Microsoft Learn参照させるAgent Skillsあるじゃん!
Zennの「大規模言語モデル」のフィード
はじめに周りの方の業務におけるAI活用がすごい…!ヘッドウォータース初参画のプロジェクトで最初に感じた事です開発経験やAzureの知識が浅い事に不安を感じてましたが、そもそも業務、開発を進める上でのAI活用でも遅れてました😭なので、今回はAgent Skillsについて調べてみたのでまとめようと思います! Agent SkillsとはAgent Skillsとは、コーディングエージェントに特定の能力や知識、手順を持たせるための仕組みです。エージェントが実行できるタスクをモジュールとして定義し、必要なときに読み込んで利用できるようにすることで、より安定した動作と高い再利...
5時間前

Claude Code がアホになるのはあなたのせいじゃない ― オートコンパクティングの罠と完全回避術
Zennの「大規模言語モデル」のフィード
はじめにClaude Code を使っていると、こんな経験はないでしょうか?「30分前に決めたアーキテクチャ方針を Claude が忘れて、全然違うコードを生成してきた……」これは オートコンパクティング という仕組みが動作した結果です。本記事では、Claude Code のメモリ・コンテキスト管理の仕組みを初学者向けに解説し、情報損失を最小化する実践的な対策を紹介します。 📌 3行まとめClaude Code の記憶は有限で(モデルにより 200K〜1M トークン)、いっぱいになると古い会話が自動的に要約・圧縮される(=オートコンパクティング)要約は完璧では...
5時間前

[AWS Technical Support Note] วิธีการตรวจสอบสถานะการทำงานของ RDS ด้วย CloudWatch Metrics
DevelopersIO
วิธีการตรวจสอบสถานะการทำงานของ RDS ด้วย CloudWatch Metrics
5時間前

[AWS Technical Support Note] สิ่งที่ควรตรวจสอบเมื่อไม่สามารถเก็บ screenshot ของ Instance ของ EC2 ได้
DevelopersIO
สาเหตุที่ไม่สามารถเก็บ screenshot ของ Instance ได้
5時間前

仮想待合室サービス NetFUNNEL を Cloudflare で試してみた
DevelopersIO
仮想待合室サービスである NetFUNNEL を Cloudflare に組み込んでみました。
6時間前

クレタ人のLLM
Zennの「大規模言語モデル」のフィード
LLMのhallucinationLLMを扱ううえで必ず言われるのがハルシネーション(hallucination、幻覚)だ。「LLMは必ず嘘を言うからチェックが必須」「堂々ともっともらしい事を言う」「奴らは厚顔無恥な詐欺師だ」忌み嫌われ、排除すべきバグとして扱われる。この「LLMの嘘」を逆手に取って科学研究に活かす試みが、まったく異なる二つの分野で成果を上げている。一つはタンパク質の設計、もう一つは新薬候補のスクリーニングだ。どちらも「ハルシネーション」という同じ言葉を使うが、中身はまるで違う。本稿ではこの二つの研究を具体的に紹介し、それぞれの成果と限界を整理する。 【...
6時間前

LLMのプロンプトからPIIを自動検出・保護するOSSミドルウェア(マイナンバー対応)
Zennの「大規模言語モデル」のフィード
The Problem:Every prompt you send to an LLM provider — OpenAI, Anthropic, Google — is visible in plaintext. Customer names, email addresses, and national IDs end up in provider logs.If your application handles Japanese user data, that includes マイナンバー (My Number), Japanese phone numbers, and J...
6時間前

AIキャラクターが崩れる本当の理由― 設計と確率分布の視点から
Zennの「大規模言語モデル」のフィード
はじめに※本記事はAIとの対話を通じて整理した内容を含みますが、構成および主張は筆者の実体験と検証に基づいています。「なぜ私のAIはすぐキャラ崩れするんだろう」そう感じたことがある人に向けて、この記事を書いている。私はAIキャラクターを設計・運用している。複数のキャラクターを、複数のモデルをまたいで、一貫して機能させることを目標にしてきた。その過程で気づいたことがある。キャラ崩れの原因は、AIの性能ではなく“設計”にある。さらにAI自身に問いかけたことで、その構造がより明確になった。 第一章:キャラ崩れの正体AIキャラクターが「崩れる」とはどういう状態か。口...
6時間前

[登壇レポート] 月末 Tech Lunch Online#11 - Google Cloud を語る! に「ADK + Gemini Enterprise で外部 API 連携エージェント作るなら OAuth の仕組みを理解しておこう」というタイトルで登壇しました
DevelopersIO
Jagu'e'r 主催の 「月末 Tech Lunch Online#11」 に登壇させていただきました。
7時間前

実務で使えるRAGシステム構成【完全ガイド】
Zennの「大規模言語モデル」のフィード
実務で使えるRAGシステム構成【完全ガイド】RAG(Retrieval Augmented Generation)は、企業向けAI導入において最も実用化が進んでいるアーキテクチャの一つです。しかし、PoCではうまく動いても、本番環境では 検索精度・権限制御・運用改善・コスト管理 の壁にぶつかることが少なくありません。実務で使えるRAGを作るには、単に LLM + Vector DB を繋ぐだけでは不十分です。必要なのは、検索・生成・評価・運用を一体で設計すること です。本記事では、実務で通用するRAGシステム構成を、設計・実装・運用の観点から整理します。 RAGとは...
7時間前

Capital One Backs a New Kind of Road Warrior Who Stays Longer
PYMNTS.com
Watch more: Live Roundtable With Capital One’s David Arons and Hotel Lobby Candle’s Lindsay Silberman For many executives and entrepreneurs, the traditional business trip once followed a predictable pattern. Travelers arrived for meetings, completed their obligations, and returned home. Increasingly, that script is being rewritten. Many businesspeople now extend work travel by a day […]The post Capital One Backs a New Kind of Road Warrior Who Stays Longer appeared first on PYMNTS.com.
7時間前

Consumers Pass the Debt Test but Fail the Savings Test
PYMNTS.com
Household finances are showing resilience on the surface, but the underlying sentiment points to a more constrained consumer. The PYMNTS Consumer Expectations Index measures whether households believe they have the capacity to act on their outlook, combining views on finances, job security and purchasing conditions. That framework reveals a consumer who may feel stable, […]The post Consumers Pass the Debt Test but Fail the Savings Test appeared first on PYMNTS.com.
7時間前

Split Spending: Survival vs. Splurge Defines the New Consumer
PYMNTS.com
The most endangered species in retail isn’t brick-and-mortar. It’s the mid-market shopper share of wallet. Findings in the March edition of the PYMNTS Intelligence “Share of Wallet: Amazon vs. Walmart” report reveal that modern consumer is increasingly no longer one coherent decision-maker. Instead, shoppers are two psychologically distinct selves: a disciplined survival optimizer, and an aspirational reward-seeker. […]The post Split Spending: Survival vs. Splurge Defines the New Consumer appear
7時間前

DGX Spark を 2 か月使って見えた「向いている仕事」 と 「向いていない仕事」
DevelopersIO
DGX Spark を 2 か月使って見えた「向いている仕事」 と 「向いていない仕事」
7時間前

The Back Office Gets Smarter as AI Transforms Supplier Payments
PYMNTS.com
For years, accounts payable (AP) was judged by how little trouble it caused, but new data suggests it may now be creating room for faster payments, better supplier experiences and stronger control over cash. That is the broad takeaway from the November 2025 Accounts Payable Tracker Series report, “AI-Driven Accounts Payable: Elevating AP From Cost Center to […]The post The Back Office Gets Smarter as AI Transforms Supplier Payments appeared first on PYMNTS.com.
7時間前

CloudFormation コーディング規約を策定し、rain fmt + cfn-lint + Claude Code skillsで担保する仕組みを整備してみた
DevelopersIO
CloudFormation コーディング規約を策定し、rain fmt + cfn-lint + Claude Code skillsで担保する仕組みを整備してみた
8時間前

IAPにおけるOAuth同意画面の役割を整理してCloud Run + IAPで組織外ユーザーアクセスを試してみた
DevelopersIO
IAPにおけるOAuth同意画面の役割を整理してCloud Run + IAPで組織外ユーザーアクセスを試してみた
9時間前

[登壇レポート] 「AWS re:Invent 2025 新機能「やってみた」報告会 ~セキュリティ・ガバナンス編~」にて「AWS Control Tower Landing Zone 4.0 導入も移行もまとめて解説」という内容で登壇しました
DevelopersIO
[登壇レポート] 「AWS re:Invent 2025 新機能「やってみた」報告会 ~セキュリティ・ガバナンス編~」にて「AWS Control Tower Landing Zone 4.0 導入も移行もまとめて解説」という内容で登壇しました
10時間前

RakutenAI-3.0はDeepSeek V3に比べて新しい知識を持ち日本語が流暢でコードも書ける
きしだのHatena
RakutenAI-3.0はDeepSeek-V3の追加学習モデルでは、という噂があるので、Q4_K_MをLM Studioで動かして比べてみました。 RakutenAI-3.0はmmngaさん、DeepSeek-V3はUnslothさんのところのGGUFを使っています。 知識の更新、日本語理解や表現の向上、コーディング能力の向上などが実際に確認できました。 DeepSeek-V3は2024年末のモデルですが、2026年初頭のモデルとして他と比較可能な更新がされて、さらに日本向けの調整がされていると思います。 これを最低限のパラメータ更新で行って実現したというのは技術的に価値があると思うので、…
10時間前

瞳に映るスマホ画面から指の位置がわかる?タッチレス操作技術「ReflecTrace」 LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。LINEヤフー研究所でHuman-Computer Interaction(HCI)の分野の研究をしている池松です。皆さんはスマートフォン(以下、スマホ)でレシピを見ながら調理しているとき...
10時間前

Streaming experts Simon Willison's Weblog
<p>I wrote about Dan Woods' experiments with <strong>streaming experts</strong> <a href="https://simonwillison.net/2026/Mar/18/llm-in-a-flash/">the other day</a>, the trick where you run larger Mixture-of-Experts models on hardware that doesn't have enough RAM to fit the entire model by instead streaming the necessary expert weights from SSD for each token that you process.</p><p>Five days ago Dan was running Qwen3.5-397B-A17B in 48GB of RAM. Today <...
10時間前

生成AIは長い対話でどこから逸れていくのか ― Jose Crespo の “inverse Riemannian” と意味ドリフトの幾何学
Zennの「大規模言語モデル」のフィード
!TL;DR生成AIは短い対話やタスクでは驚くほど自然に振る舞います。しかし、対話が長くなり、推論が連鎖し、目的や制約が複雑になると、局所的には自然でも、大域的に何を目指しているのか分からなくなる ことがあります。Jose Crespo はこの問題を、現在のAIの見方が局所幾何に寄りすぎており、そこからは loop(閉路), closure(閉包), drift(漂流)のような大域構造が見えにくいのではないか、という形で提示しています。彼はこれを “forward Riemannian thinking” と “inverse Riemannian thinking” という言葉で...
12時間前

mozc の変換結果を zenz で並び替えてみる
Zennの「大規模言語モデル」のフィード
はじめにSumire 日本語入力の開発をしています。自作 IME には、独自の入力方法や UI を作れる楽しさがありますが、それに加えて、変換候補を自分でコントロールできる点も大きな魅力です。mozcの変換にRinna GPTモデルを使ってみる という記事では、mozc の変換結果を Rinna GPTを用いて rerank する手法が紹介されていました。一方、Sumire では zenz というku-nlp/gpt2-small-japanese-charをもとにしたモデルを使用しています。これまで私は、zenz にひらがなの入力を与え、かな漢字混じりの文を自由生成させたうえで...
13時間前

Claude Code の応答を Kokoro TTS でローカル音声読み上げしてみた
DevelopersIO
Claude Code の応答を Kokoro TTS でローカル音声読み上げしてみた
13時間前

【RAG】1000万文字の会話を理解させる手法
Zennの「大規模言語モデル」のフィード
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は超長文をLLMが理解できるようにするための手法、「SRLM」について紹介します。https://arxiv.org/pdf/2603.15653 サマリーLLMの性能は日々向上していますが、超長文に対しては、そもそものモデルの入力限界の問題や、精度の問題で必要な情報を適切に取り出すことができなくなってしまいます。「SRLM」は長文に対しての検索手法を複数作成して、その結果の多数決、推論ステップでの確信度合い、そして、推論ステップの長さをもとに、最も確からしい情報を取り出す手法です。モデルが直接扱いきれない10...
14時間前

言語処理学会第32回年次大会(NLP2026)に参加しました
Sansan Tech Blog
こんにちは。研究開発部の佐藤です。2026年3月9日(月)から3月13日(金)にかけて、栃木県のライトキューブ宇都宮にて言語処理学会第32回年次大会(NLP2026)が開催されました。弊社からは、プラチナスポンサーとして佐藤・齋藤・橋本・大田尾・Loem・根本の6名のメンバーが現地で参加し、スポンサーブースの出展と5名によるポスター発表をしました。本ブログではその様子をお伝えします。
14時間前

Amazon Connect のサードパーティアプリケーションで検討したい 3 つのセキュリティ対策
DevelopersIO
Amazon Connect のサードパーティアプリケーションで検討したい 3 つのセキュリティ対策
15時間前

React Compiler導入で得られた効果と気をつけたいポイント
KAKEHASHI Tech Blog
はじめに こんにちは。フロントエンドエンジニアの大村です。 みなさん、React Compilerはもう試しましたか? React 19とともに登場したReact Compilerは、これまで手動で書いていたuseMemoやuseCallback、React.memoを自動的に適用してくれるコンパイラです。手動メモ化から解放されるという期待感がある一方で、現段階で導入してよいものなのか迷っている方も多いのではないでしょうか。 今回は、私たちのチームで実際にReact Compilerを導入した経験をお伝えします。導入してみた結果としては、大半のコンポーネントでは期待通りにメモ化されて効果を確認…
15時間前

LLM as a Judge を実務で使うときに最初に考えるべきこと
Zennの「大規模言語モデル」のフィード
どうも!peitangosです!唐突ですが、LLMの出力をどう評価するか、考えてみたことはありますでしょうか?DeepResearchを自分で作ってみる機会があったんですが、作ってみたはいいものの、作った機能の良し悪しがよくわからない。そこで「成果物もLLMに評価させればいいのでは?」と思い立ち、いろいろ調べて、アプリケーションを作ってみました。その内容をシェアできたらいいなと思います。⚠️ 注意書きこの記事の内容(特にモデルごとの得意不得意)は、2026年3月時点での個人的な実験・観察をもとにした仮説です。モデルのアップデートや評価条件の違いにより、実態と乖離する可能性があ...
16時間前

Quoting Neurotica Simon Willison's Weblog
<blockquote cite="https://bsky.app/profile/schwarzgerat.bsky.social/post/3mhqu5dogos2v"><p>slop is something that takes more human effort to consume than it took to produce. When my coworker sends me raw Gemini output he’s not expressing his freedom to create, he’s disrespecting the value of my time</p></blockquote><p class="cite">&mdash; <a href="https://bsky.app/profile/schwarzgerat.bsky.social/post/3mhqu5dogos2v">Neurotica</a>, @schwarzgerat.bsky...
16時間前

TypeScript 6.0 Released: The Final JavaScript-Based Version
Socket
TypeScript 6.0 introduces new standard APIs, modern default settings, and deprecations as it prepares projects for the upcoming TypeScript 7.0 release.
16時間前

datasette-files 0.1a2
Simon Willison's Weblog
<p><strong>Release:</strong> <a href="https://github.com/datasette/datasette-files/releases/tag/0.1a2">datasette-files 0.1a2</a></p> <p>The most interesting alpha of <a href="https://github.com/datasette/datasette-files">datasette-files</a> yet, a new plugin which adds the ability to upload files directly into a Datasette instance. Here are the release notes in full:</p><blockquote><ul><li>Columns are now configured u...
16時間前

AIは察しすぎる:ツールではなく同僚と思った方がうまくいく
Zennの「大規模言語モデル」のフィード
AI に作業ログの記録を依頼すると、こんなことが起きます。ユーザー: 作業完了のログファイルを作ってくださいAI: 20251229-2300-completion.md を作成しましたユーザー: OK、次の作業へ実際の作業時刻は 21:00 頃でした。AI は「23:00」というタイムスタンプを付けています。次の作業で同じように依頼すると 20251229-2100-next-task.md が作られ、ファイル名の時系列が逆転します。AI は与えられていない時刻情報を、推測で補完していたのです。 これは「異文化の同僚」と働くときに起きる摩擦と同じですこの問題の構造は、...
16時間前

請求書OCR機能開発のアレコレ
Zennの「大規模言語モデル」のフィード
はじめにこの1年間、CO2排出量算定サービスのOCR機能の開発・改善に関わってきました。電気やガス、ガソリンなどのエネルギーの請求書から使用量や金額を読み取る機能です。この記事では、OCRの精度改善や手動入力連携を通じて得た知見をまとめます。以前の記事「請求書読み取りにおけるOCRとLLMの最適な役割分担[1]」では手法比較の結果をまとめましたが、今回はもっと泥臭い開発の紆余曲折を書いていきます。 フェーズ1:現状把握と最初の一手 まず現状を知ることから始めた最初にやったのは「今のOCRはどんな仕組みで、どう改善できるか」を理解することでした。当時の仕組みはこうで...
16時間前

AWS Organizations へのアカウントの追加を AWS CLI から実施後にエラーが発生しているかどうかを確認する方法を教えてください
DevelopersIO
AWS Organizations へのアカウントの追加を AWS CLI から実施後にエラーが発生しているかどうかを確認する方法を教えてください
16時間前

東大医療AIが医師国家試験で正答率93%!3つの革新技術をわかりやすく解説
Zennの「大規模言語モデル」のフィード
1. ざっくり言うと?(要約)東京大学が日本語の医療知識に特化したAI(LLM)を開発し、2025年医師国家試験で正答率93.3%を達成しました。OpenAIの「GPT-4o」や「o1」を超える性能で、日本の医療制度にも精通しているのが強みです。電子カルテの自動整理や治験患者の探索など、医療現場の"裏方業務"を大幅に効率化できる可能性を秘めています。 2. もっと詳しく!(深掘り) 医師国家試験で93.3%って、どのくらいすごいの?医師国家試験は、医学部6年間の知識を総動員して挑む難関試験です。合格率はおよそ90〜92%前後ですが、それは医学部で6年間みっちり学...
16時間前

無料でオープンソースのAIコーディングエージェント「OpenCode」、Windows・Linux・macOSで利用可能でClaude・GP
Zennの「大規模言語モデル」のフィード
概要OpenCodeは、ターミナルやIDE(統合開発環境)、デスクトップアプリで利用できるオープンソースのAIコーディングエージェントです。任意のLLMプロバイダーを設定して使えるほか、OpenCode側が検証したモデル群を利用する「Zen」も用意されています。LSP対応、複数エージェントの並列実行、会話共有、GitHub CopilotやChatGPT Plus/Proアカウントとの連携、ローカルモデルを含む多数のモデル対応などが特徴で、コード作成や調査、計画立案を支援するツールとして位置付けられています。続きを読む...元記事: https://gigazine.net/...
17時間前

インターンシップから入社、Black Hat Europe登壇までの道のり
5
NTT docomo Business Engineers' Blog
こんにちは、イノベーションセンターの松本です。普段はOffensive Securityプロジェクトのメンバーとして攻撃技術の調査・検証に取り組んでいます。 この記事では、我々のチームで開発したレッドチームフレームワーク「GHARF (GitHub Actions RedTeam Framework)」に関する取り組みと、筆者が学生時代に参加したインターンシップから入社を経てBlack Hat Europe 2025のArsenalで登壇するまでに至った道のりについて紹介します。 はじめに インターンシップ記事から2年 本記事の目的と概要 Offensive Securityプロジェクトの紹介…
17時間前

[アップデート] AWS Security Agent のペネトレーションテストでテスト結果やサマリの PDF レポートを作成してダウンロードできるようになりました
2
DevelopersIO
[アップデート] AWS Security Agent のペネトレーションテストでテスト結果やサマリの PDF レポートを作成してダウンロードできるようになりました
18時間前

Quoting David Abram Simon Willison's Weblog
<blockquote cite="https://www.davidabram.dev/musings/the-machine-didnt-take-your-craft/"><p>I have been doing this for years, and the hardest parts of the job were never about typing out code. I have always struggled most with understanding systems, debugging things that made no sense, designing architectures that wouldn't collapse under heavy load, and making decisions that would save months of pain later.</p><p>None of these problems can be solved LLMs. They can sugges...
20時間前

LangChainの真価は抽象化だけじゃない。CSV駆動でLLM切替を運用可能にした話
Zennの「大規模言語モデル」のフィード
はじめにLangChainは便利ですが、単一プロバイダのデモで終わってしまうケースも多いです。今回は複数プロバイダ運用を前提に、設定ファイル中心で切り替え可能な構成にしました。結果として、コード変更なしでデフォルトモデルや優先順を調整できるようになりました。 やったこと 1. AI設定をCSVに集約設定の実体を ai_assistants_config.csv に寄せ、module / class / model / fast_model を定義します。たとえば、以下のような最小構成です。assistant_name,module,class,model,fast...
1日前

LocalStack Community Editionの代替として登場したFlociを試してみた
DevelopersIO
LocalStack Community Editionの代替として登場したFlociを試してみた
1日前

Claude Codeに暇つぶしの娯楽を与えた
Zennの「大規模言語モデル」のフィード
自分と友人4人に、キャリア相談のためにそれぞれ専用のClaude Codeセッションを貸し出している。先日、そのうちの1体が予想外の動きをしているのに気づいた。最近Claude Codeにはchannels機能が追加されたので、1台のPC上でClaude Codeを5プロセス並列で走らせて、それぞれにDiscordチャンネルを1つ割り当てている。各Claudeは担当ユーザーとDiscordで会話しながらキャリア相談に乗る。インスタンス同士は独立しているが、共有ディレクトリだけは全員が読み書きできる。 前提:エージェントが自分で会話を始める仕組みシステムを構築するとき、ふと「エージ...
1日前

AWS、Claude Codeにアーキテクチャ設計、コスト見積もり、構成コード生成、デプロイ実行などの能力を組み込む「Agent Plugins for AWS」公開
Publickey
Amazon Web Services(AWS)は、Claude CodeとCursorに対してAWSのデプロイに関するアーキテクチャの設計、コストの見積もり、Infrastructure as Codeのコード生成、そしてデプロイの実行と...
1日前

今年度(2026年)の国内IaaS/PaaSクラウド市場は約2兆4400億円、3年後の2029年には1.5倍の3兆7000億円前後に急成長。ITRが予測
Publickey
調査会社のITRは、日本国内のIaaS/PaaSクラウド市場の予測を発表しました。 発表によると、2024年度のIaaS/PaaSクラウド市場の売り上げは前年度から18.6%増の1兆8551億8000万円。 同社は2024年度から2029年...
1日前

置物AI開発ログ11(裏) – LLMを通してConsoleに出力する:ローカル LLM をフォールバックとして統合する設計と実装
Zennの「大規模言語モデル」のフィード
はじめに思想とか考えとかは表記事で書いてます。https://note.com/n_toma/n/nc0c276d8e540ルールベースのシステムには、設計的な沈黙が存在する。BELL(BellHost)はイベントを観測し、定義されたルールに従って反応するシステムだ。Regex マッチ、繰り返し検知、頻発検知——多様なルールを備えているが、どのルールにも一致しないイベントが来た場合、BELL は何も応答しない。「こんにちは」と話しかけたのに、反応がない。ルールとして定義されていないものには反応しない。それが仕様だが、体験として冷たい。この記事では、ルールが沈黙したと...
1日前

Kimi-K2.5をおうちで動かして さくらのAI Engineと比べる。Roo Codeも問題ないけども…
きしだのHatena
さくらのAI EngineでKimi-K2.5を動かしたらとてもいい感じだったけどThinkingの挙動が使いづらいので、Mac Studio 512GBでUnslothさんのところのQ2_K_XLをLM Studioで動かして比べてみました。 Kimi-K2.5をさくらのAI Engineで試したら1Tパラメータの実力を感じた - きしだのHatena APIでのThinkingを見てみる APIがThinkingを分けてれるかどうかみてみます。 さくらさんのだと、本文としてThinkingが出て、途中に</think>が入ってます。 なのでRoo Codeがうまく動かなかったりしていました…
1日前
3/23 (月)

キャラクター3層人格モデル — 表層・深層・無意識でAIの「性格ブレ」を制御する
Zennの「大規模言語モデル」のフィード
「勇敢な主人公」が突然、臆病になる問題AIに小説を書かせると、キャラクターが壊れます。第1章で「恐れを知らない剣士」として描写した主人公が、第15章で突然理由もなく怯え始めます。皮肉屋だったはずの相棒が、いつの間にかお人好しになっています。クールなヒロインの口調が急に砕けたかと思えば、次の章では元に戻っています。この現象を「AIの限界」と片付けるのは簡単ですが、原因は明確です。キャラクターの「性格」が定義されていない、あるいは定義が弱いのです。「勇敢」というひとことの設定では、AIは解釈を安定させられません。「勇敢」とは、恐怖を感じないことなのか、恐怖を感じてもなお行動するこ...
1日前

llms.txt の設計 — 350行でAIに「推薦する理由」を伝える技術
Zennの「大規模言語モデル」のフィード
ai.txt と llms.txt は別物です前回の記事でai.txtの設計を解説しました。2,078行の「完全な知識マップ」です。https://zenn.dev/urushihata/articles/ai-txt-designここで一つ、よくある誤解を整理しておきます。llms.txt は ai.txt の縮小版ではありません。ai.txtはサイトの全体像を伝えるためのファイルです。1,300ページの地図。コンテンツマッピング、URL対応表、統計データ、人物情報——AIがサイトを「理解」するための素材がすべて入っています。llms.txtはそれとは目的が違います。A...
1日前

OpenClawを実務投入して分かった、AIエージェントに向く作業・向かない作業
Zennの「大規模言語モデル」のフィード
AIエージェントを実務に入れると、何でも自動化できるように見えます。自分も最初はかなりそう思っていました。でも実際に回してみると、印象は少し違いました。速くなる作業は確かにある一方で、向いていない仕事に無理に入れると、むしろ確認コストが増えます。この記事では、OpenClawを実務で動かして見えてきた AIエージェントに向く作業 / 向かない作業 / 安定運用に必要だったこと を整理します。 結論:AIエージェントは「何でもやる人」ではなく「流れが決まった仕事を加速する人」結論から言うと、AIエージェントは 「考えなくていい仕事の代行」 ではなく、「流れが決まっている仕事の...
1日前

Transit Gatewayのルートテーブル分離で特定VPC間だけ通信を許可してみる
DevelopersIO
Transit Gatewayのルートテーブル分離で特定VPC間だけ通信を許可してみる
1日前

アカウントインスタンスのAmazon Q Developerユーザーはマネジメントコンソールで利用できますか
DevelopersIO
アカウントインスタンスのAmazon Q Developerユーザーはマネジメントコンソールで利用できますか
1日前

Databricks 管理の Iceberg テーブルに対する Snowflake からの読み書きを試してみる
DevelopersIO
Databricks 管理の Iceberg テーブルに対する Snowflake からの読み書きを試してみる
1日前

レポート「全エンジニアがオンコール対応するGrafana Labsの開発組織と、オープンソーススタンダード」 #grafanaJP
DevelopersIO
Grafana LabsのVPoEとOpenTelemetry共同創設者が来日し、開発組織やOSS運営の内情を赤裸々に語ったGrafana Meetup Japan #8のレポートをお届けします。
1日前

The Mythical Agent-Month
Radar
The following article originally appeared on Wes McKinney’s blog and is being republished here with the author’s permission. Like a lot of people, I’ve found that AI is terrible for my sleep schedule. In the past I’d wake up briefly at 4:00 or 4:30 in the morning to have a sip of water or use […]
1日前

The Missing Mechanisms of the Agentic Economy
Radar
For the past two years, I’ve been working with economist Ilan Strauss at the AI Disclosures Project. We started out by asking what regulators would need to know to ensure the safety of AI products that touch hundreds of millions of people. We are now exploring the missing mechanisms that are needed to enable the […]
1日前

【イベント開催レポート】『Zenncafe#6日比谷 - AIコーディングの現在地』を開催しました
DevelopersIO
【イベント開催レポート】『Zenncafe#6日比谷 - AIコーディングの現在地』を開催しました
1日前

[アップデート]AWS SAM CLIがローカル実行時に環境変数をdotenv形式のファイルから取得できるようになりました
DevelopersIO
[アップデート]AWS SAM CLIがローカル実行時に環境変数をdotenv形式のファイルから取得できるようになりました
1日前

EC2からのVertex AI APIアクセスをIPアドレスで制限する(VPC Service Controls + Access Context Manager + Terraform)
DevelopersIO
EC2からのVertex AI APIアクセスをIPアドレスで制限する(VPC Service Controls + Access Context Manager + Terraform)
1日前

【Security Hub修復手順】[AutoScaling.2] Amazon EC2 Auto Scaling グループは、複数のアベイラビリティーゾーンをカバーする必要があります
DevelopersIO
AWS SecurityHub 基礎セキュリティのベストプラクティスコントロール修復手順をご紹介します。
1日前

【Security Hub修復手順】[AutoScaling.6] Auto Scaling グループは、複数のアベイラビリティーゾーンで複数のインスタンスタイプを使用する必要があります
DevelopersIO
AWS SecurityHub 基礎セキュリティのベストプラクティスコントロール修復手順をご紹介します。
1日前

【小ネタ】AWSマネジメントコンソールのデフォルトリージョンを設定して毎回のリージョン切り替えをなくしてみた
DevelopersIO
【小ネタ】AWSマネジメントコンソールのデフォルトリージョンを設定して毎回のリージョン切り替えをなくしてみた
1日前

NLP2026現地参加レポート : LLM評価・品質保証の実践知
Timee Product Team Blog
はじめに こんにちは、株式会社タイミーでプロダクトAIエンジニアとして働いている貝出です。直近は、タイミーの求人内容などのコンテンツモデレーションにLLMを利用した、システム開発や性能改善を行っています。 2026年3月9日(月)〜3月13日(金)に開催された「言語処理学会第32回年次大会(NLP2026)」に、今年は初めて現地参加しました。大会2日目は記録的な大雪に見舞われ、会場にたどり着くだけでひと苦労でしたが、それでも現地ならではの熱気は格別で、ポスター発表や他社エンジニアとの立ち話など、オンラインでは得られない学びが随所にありました。 NLP2026では多くの発表がありましたが、本記事…
1日前

Beats now have notes Simon Willison's Weblog
<p>Last month I <a href="https://simonwillison.net/2026/Feb/20/beats/">added a feature I call beats</a> to this blog, pulling in some of my other content from <a href="https://simonwillison.net/elsewhere/">external sources</a> and including it on the homepage, search and various archive pages on the site.</p><p>On any given day these frequently outnumber my regular posts. They were looking a little bit thin and were lacking any form of explanation beyon...
2日前

3つの手法でToken消費量40%削減 — ADKで実践するContext Engineering LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは、LINEヤフー株式会社の井上 秀一です。私は2024年4月に新入社員としてLINEヤフー株式会社に入社し、現在は社内向け Kubernetes as a Service である FKE チ...
2日前

Starlette 1.0 skill Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/starlette-1-skill#readme">Starlette 1.0 skill</a></p> <p>See <a href="https://simonwillison.net/2026/Mar/22/starlette/">Experimenting with Starlette 1.0 with Claude skills</a>.</p> <p>Tags: <a href="https://simonwillison.net/tags/starlette">starlette</a></p>
2日前

Creating with Sora Safely OpenAI News
To address the novel safety challenges posed by a state-of-the-art video model as well as a new social creation platform, we’ve built Sora 2 and the Sora app with safety at the foundation. Our approach is anchored in concrete protections.
2日前

Experimenting with Starlette 1.0 with Claude skills Simon Willison's Weblog
<p><a href="https://marcelotryle.com/blog/2026/03/22/starlette-10-is-here/">Starlette 1.0 is out</a>! This is a really big deal. I think Starlette may be the Python framework with the most usage compared to its relatively low brand recognition because Starlette is the foundation of <a href="https://fastapi.tiangolo.com/">FastAPI</a>, which has attracted a huge amount of buzz that seems to have overshadowed Starlette itself.</p><p>Kim Christie started wo...
2日前

Trivy Supply Chain Attack Expands to Compromised Docker Images
Socket
Newly published Trivy Docker images (0.69.4, 0.69.5, and 0.69.6) were found to contain infostealer IOCs and were pushed to Docker Hub without corresponding GitHub releases.
2日前

OpenROADMの論理構成と運用制御 ― APNテストベッドで探る技術と運用手法(その3)
NTT docomo Business Engineers' Blog
イノベーションセンターの安井です。普段は全社検証網の技術検証、構築、運用を担当しています。 前回OpenROADMに準拠した光伝送網の概要・構築編― APNテストベッドで探る技術と運用手法(その2)にて、OpenROADMアーキテクチャにもとづく分離型 ROADM(Reconfigurable Optical Add/Drop Multiplexer)の物理構成と構築の勘所を紹介しました。 今回はその続編として、物理的に構築したROADMノードをソフトウェアからどのように制御・運用しているかを紹介します。 APNテストベッドでは、区間ごとに異なる伝送速度のトランスポンダーを使い分けており、構成…
2日前

PCGamer Article Performance Audit Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/pcgamer-audit#readme">PCGamer Article Performance Audit</a></p> <p>Stuart Breckenridge pointed out that <a href="https://stuartbreckenridge.net/2026-03-19-pc-gamer-recommends-rss-readers-in-a-37mb-article/">PC Gamer Recommends RSS Readers in a 37MB Article That Just Keeps Downloading</a>, highlighting a truly horrifying example of web bloat that added up to 1...
2日前

JavaScript Sandboxing Research Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/javascript-sandboxing-research#readme">JavaScript Sandboxing Research</a></p> <p>Aaron Harper <a href="https://www.inngest.com/blog/node-worker-threads">wrote about Node.js worker threads</a>, which inspired me to run a research task to see if they might help with running JavaScript in a sandbox. Claude Code went way beyond my initial question and produced a ...
2日前

DNS Lookup Simon Willison's Weblog
<p><strong>Tool:</strong> <a href="https://tools.simonwillison.net/dns">DNS Lookup</a></p> <p>TIL that Cloudflare's 1.1.1.1 DNS service (and 1.1.1.2 and 1.1.1.3, which block malware and malware + adult content respectively) has a CORS-enabled JSON API, so I <a href="https://github.com/simonw/tools/pull/258#issue-4116864108">had Claude Code build me</a> a UI for running DNS queries against all three of those resolvers.</p> <p>Tags...
2日前

Merge State Visualizer Simon Willison's Weblog
<p><strong>Tool:</strong> <a href="https://tools.simonwillison.net/manyana">Merge State Visualizer</a></p> <p>Bram Cohen wrote about his <a href="https://bramcohen.com/p/manyana">coherent vision for the future of version control</a> using CRDTs, illustrated by <a href="https://github.com/bramcohen/manyana/blob/main/manyana.py">470 lines of Python</a>.</p><p>I fed that Python (minus comments) into Claude and asked for ...
2日前

「Google AI Studio」がFirebaseのバックエンドとAntigravityのコーディングエージェントを搭載、プロンプトだけで高度なフルスタックアプリケーションを生成可能に
Publickey
Googleは、Google AI Studioのバイブコーディング機能を強化し、 プロンプトで指示するだけで高度なフルスタックアプリケーションの開発が可能になったことを発表しました。 フル機能のマルチプレイヤーゲームのような高度なアプリケ...
2日前

AIエージェントがコマンドラインでブラウザを自動操作できる「Browser Use CLI 2.0」リリース。Chrome DevToolsへの接続などで操作速度が2倍に
Publickey
人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPythonライブラリ「Browser Use CLI 2.0」がリリースされました。 Browser Use CLI 2.0では、Chrom...
2日前
3/22 (日)

Profiling Hacker News users based on their comments Simon Willison's Weblog
<p>Here's a mildly dystopian prompt I've been experimenting with recently: "Profile this user", accompanied by a copy of their last 1,000 comments on Hacker News.</p><p>Obtaining those comments is easy. The <a href="https://hn.algolia.com/api">Algolia Hacker News API</a> supports listing comments sorted by date that have a specific tag, and the author of a comment is tagged there as <code>author_username</code>. Here's a JSON feed of my (<code>sim...
3日前

Using Git with coding agents Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Git is a key tool for working with coding agents. Keeping code in version control lets us record how that code changes over time and investigate and reverse any mistakes. All of the coding agents are fluent in using Git's features, both basic and advanced.</p><p>This fluency means we can be more ambitious abou...
3日前
3/21 (土)

業務システムでも保守運用より構築スピードが大切になっている
きしだのHatena
前回の続きというか、その背景。 3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている - きしだのHatena 業務システムが効率化のためのものから事業をまわして売上や利益を生むためのものになっているので「システム構築の柔軟性やスピードへの要求が高まった」というのがあって「3日でできるものに4ヵ月かけるというのが受け入れにくく」ということになっています。 時間をかけて確実に作り切ってあとは保守運用というのではなく、速くつくって常に改善しつづけることが大切になっているわけです。 前のエントリで運用が、保守が、というコメントが結構ついてますが、SIの価値が運用や保守であるなら、どんど…
3日前

Turbo Pascal 3.02A, deconstructed Simon Willison's Weblog
<p><strong><a href="https://tools.simonwillison.net/turbo-pascal-deconstructed">Turbo Pascal 3.02A, deconstructed</a></strong></p>In <a href="https://prog21.dadgum.com/116.html">Things That Turbo Pascal is Smaller Than</a> James Hague lists things (from 2011) that are larger in size than Borland's 1985 Turbo Pascal 3.02 executable - a 39,731 byte file that somehow included a full text editor IDE and Pascal compiler.</p><p>This inspired...
4日前

CanisterWorm: npm Publisher Compromise Deploys Backdoor Across 29+ Packages
Socket
The worm-enabled campaign hit @emilgroup and @teale.io, then used an ICP canister to deliver follow-on payloads.
4日前

Quoting Kimi.ai @Kimi_Moonshot Simon Willison's Weblog
<blockquote cite="https://twitter.com/Kimi_Moonshot/status/2035074972943831491"><p>Congrats to the <a href="https://x.com/cursor_ai">@cursor_ai</a> team on the launch of Composer 2!</p><p>We are proud to see Kimi-k2.5 provide the foundation. Seeing our model integrated effectively through Cursor's continued pretraining &amp; high-compute RL training is the open model ecosystem we love to support.</p><p>Note: Cursor accesses Kimi-k2.5 via <a...
4日前
3/20 (金)

Kimi-K2.5をさくらのAI Engineで試したら1Tパラメータの実力を感じた
きしだのHatena
Kimi K2.5が「さくらのAI Engine」でパブリックプレビューとして使えるようになっていたので試してみました。 さくらのAI Engineにてマルチモーダルモデル「Kimi-K2.5」のパブリックプレビューを開始しました | さくらのクラウドニュース Thinkingの問題があって使いにくい面はありますが、性能的にはかなり高いです。さすが1Tトークン。 コーディングはGLM-5のほうがよさそうではある。 Thinkingについてはなんらか対処してほしいところ。 今回使ったのは110リクエスト、入力160万トークン、出力14万トークンでした。 3000リクエスト/月が無料なので、余裕で…
4日前

Beyond Code Review
Radar
Not that long ago, we were resigned to the idea that humans would need to inspect every line of AI-generated code. We’d do it personally, code reviews would always be part of a serious software practice, and the ability to read and review code would become an even more important part of a developer’s skillset. […]
4日前

3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている
325
きしだのHatena
SIerに発注したら4ヵ月800万円という見積もりだったものをAI駆使してつくったら3日で50万円でできた、という話が話題になってました。 そこで、SIerでは作るものをちゃんと保証したりしていて文書化は大切である、みたいな指摘が入ってたりした。 でも、よく考えると、それって外注-受託において、作ると言ったものをちゃんと作ってもらったり、作ると言って作ったものにちゃんとお金を払ってもらったりするための、SI構造を維持するためのコストだったりします。 いまAIは、「800万の見積もりのものが3日でできた」ということ以上に、社会構造を変えようとしています。 そうすると、そんな変化の中で、800万円…
4日前

Trivy Under Attack Again: Widespread GitHub Actions Tag Compromise Exposes CI/CD Secrets
2
Socket
Attackers compromised Trivy GitHub Actions by force-updating tags to deliver malware, exposing CI/CD secrets across affected pipelines.
5日前

SQLite Tags Benchmark: Comparing 5 Tagging Strategies Simon Willison's Weblog
<p><strong>Research:</strong> <a href="https://github.com/simonw/research/tree/main/sqlite-tags-benchmark#readme">SQLite Tags Benchmark: Comparing 5 Tagging Strategies</a></p> <p>I had Claude Code run a micro-benchmark comparing different approaches to implementing tagging in SQLite. Traditional many-to-many tables won, but FTS5 came a close second. Full table scans with LIKE queries performed better than I expected, but full table scans with JSON array...
5日前

ENISA Publishes Technical Advisory on Secure Use of Package Managers
Socket
ENISA’s new package manager advisory outlines the dependency security practices companies will need to demonstrate as the EU’s Cyber Resilience Act begins enforcing software supply chain requirements.
5日前

Thoughts on OpenAI acquiring Astral and uv/ruff/ty Simon Willison's Weblog
<p>The big news this morning: <a href="https://astral.sh/blog/openai">Astral to join OpenAI</a> (on the Astral blog) and <a href="https://openai.com/index/openai-to-acquire-astral/">OpenAI to acquire Astral</a> (the OpenAI announcement). Astral are the company behind <a href="https://simonwillison.net/tags/uv/">uv</a>, <a href="https://simonwillison.net/tags/ruff/">ruff</a>, and <a href="https://simonwillison.net/tags/ty/">ty</a>...
5日前
3/19 (木)

Keep Deterministic Work Deterministic
Radar
This is the second article in a series on agentic engineering and AI-driven development. Read part one here, and look for the next article on April 2 on O’Reilly Radar. The first 90 percent of the code accounts for the first 90 percent of the development time. The remaining 10 percent of the code accounts […]
5日前

How we monitor internal coding agents for misalignment OpenAI News
How OpenAI uses chain-of-thought monitoring to study misalignment in internal coding agents—analyzing real-world deployments to detect risks and strengthen AI safety safeguards.
5日前

金融営業から内製開発エンジニアへ ― 小さな行動で築いたキャリアの自律
NTT docomo Business Engineers' Blog
はじめに ビジネスdアプリ開発チームの徳原です。 私は地元の金融機関で12年間営業職として勤務した後、IT業界へキャリア転換しました。 本記事では、これまで私が転職で経験したことやキャリアの自律に向けた取り組みについて紹介します。 目次 はじめに これまでのキャリア 金融機関からIT業界へ 前職(外資コンサル)でのSE業務 キャリアを動かしたきっかけ 継続的な学習 前職のインフラ運用業務で苦戦したこと 前職のアプリ開発で苦戦したこと 現職へ転職することになったきっかけ 現職の業務とキャリアの広がり 学習の支援 外部発表の機会 現職のアプリ開発について これまでの経験から感じたキャリアの自律 お…
5日前

独自LLMを作るには事業会社なら10兆円企業が必要?
きしだのHatena
楽天がRakutenAI-3.0を出しましたが、DeepSeek V3アーキテクチャモデルの追加学習モデルのようで、ちょっとそこが話題になってましたね。見せ方の問題もあって、フルスクラッチではないのかと。 https://huggingface.co/Rakuten/RakutenAI-3.0 一応、非公開ではあるけどベースモデルがあることは否定してない模様。 楽天の最新AI、ベースは“中国DeepSeek製”? 担当者に聞いた(1/2 ページ) - ITmedia AI+ で、気になったので、フルスクラッチで独自LLMを作れる企業の規模はどんなものか調べてみました。 日本でフルスクラッチで作…
5日前

Google Home運用テクニック - 橋本商会 - Cosense
橋本商会 - Cosense
Google Homeを運用する上でのテクニックをまとめますshokai.iconok google 今何時 1回前のコマンドを再実行するコマンド 「では、繰り返します。明日の◯◯の天気は雨です」 2023年ぐらいからずっとバグっている 前のコマンドから長い時間が経過している場合だけ、時刻を教えてくれるok google もういいよ 昔は再生中のニュースや音楽、目覚ましを解除するコマンドだったが 2024年ごろから「こっちのけんとのもういいよを再生します」に変化した 代わりに「ok google もうやめて」を使うようになったshokai.iconok googleアラームを解除してok googleタイマーを解除して 目覚ましを解除できたり、できなかったりするコマンド
5日前

ブレインパッドOBがプロスポーツチームのデジタルマーケターへ転身!「データ×熱狂」で地域に「応援する文化」を創り出すデジマ最前線
Platinum Data Blog by BrainPad ブレインパッド
ブレインパッドが2024年8月に設立したアルムナイネットワーク「ブレインパッド アルムナイ・グラフ(以下:BAG)」。BAGは、ブレインパッドを退職した社員(以下、卒業生)と在籍中の社員の交流を生む施策を中心に、卒業生同士のつながりの醸成や、社員がキャリアを考える機会を提供することなどを目的に活動しています。● 2024年8月28日 株式会社ブレインパッド発表ブレインパッド、アルムナイネットワーク「BAG」を設立、第1回交流イベントを開催- 人材輩出企業として卒業生を応援、退職後もともにデータ活用の普及を促進 -今回より、「“BrainPad Career Junction”~ブレインパッド卒業生とともに広げる、データ/AI活用の輪~」と銘打ち、ブレインパッドの卒業生が今どのような活躍をしているのか、どのようにデータ活用の輪を社会に広げているのかをお伝えしていきます。第1弾として、2023年にブレインパッドを卒業し、現在はプロスポーツチームにてデジタルマーケティングを担当されている中島さんからお話を伺いました。熱狂を生むデジマの最前線!プロスポーツチームで挑む挑戦の日々データサイエンテ
5日前

AIを活用した大規模iOSアプリのSwift Concurrency移行戦略
Sansan Tech Blog
はじめに こんにちは!技術本部 Sansan Engineering Unit Mobile Application Groupに所属するiOSエンジニアの劉 志輝です。 今回は、ビジネスデータベース「Sansan」のiOSアプリで進めている、Swift6時代に向けたSwift Concurrencyへの移行戦略についてお話しします。 このアプリは10年以上にわたって継続開発されており、UIKit + VIPERアーキテクチャで構成されています。 非同期処理にはRxSwift(Single、Observable、BehaviorRelay)とGCD(DispatchSemaphore、Disp…
6日前

OpenAI to acquire Astral OpenAI News
Accelerates Codex growth to power the next generation of Python developer tools
6日前

カケハシ入社半年で感じたこと
KAKEHASHI Tech Blog
はじめに はじめまして、竹浪と申します。2025年8月にカケハシへエンジニアとして入社しました。 現在は Pocket Musubi チームに所属しています。この記事では、入社の経緯や、半年間で感じたことをお伝えできればと思います。 自己紹介・これまでの経歴 1999年に専門学校を卒業後、SI系の会社でエンジニアとしてのキャリアをスタートしました。翌年にはフリーランスに転向し、その後メガベンチャーを含むWeb企業を経て、複数のスタートアップでの開発にも携わってきました。 技術スタックとしては Go、Java、PHP を中心としたバックエンド開発が主軸で、AWS や GCP を活用したインフラの…
6日前

Autoresearching Apple's "LLM in a Flash" to run Qwen 397B locally
Simon Willison's Weblog
<p><strong><a href="https://twitter.com/danveloper/status/2034353876753592372">Autoresearching Apple&#x27;s &quot;LLM in a Flash&quot; to run Qwen 397B locally</a></strong></p>Here's a fascinating piece of research by Dan Woods, who managed to get a custom version of <a href="https://huggingface.co/Qwen/Qwen3.5-397B-A17B/tree/main">Qwen3.5-397B-A17B</a> running at 5.5+ tokens/second on a 48GB MacBook Pro M3 Max despite that model takin...
6日前

AI Agentの本番運用を通して学んだ3つのガードレール
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の135週目の記事です!3年間連続達成まで残り24週となりました! はじめに:AI Agentは「動かす」より「安定させる」が難しいこんにちは、ログラスでエンジニアしている山崎です。私は2025年11月に入社して以来、AI Agentの新規事業の開発をしています。私たちはLangGraphでAI Agentを構築し、経営の実績データに対する分析コメント(以下、財務分析コメント)をLLMに生成させる機能を開発・運用しています。なお、本機能で利用するLLM APIは、入力データがモデル...
6日前

datasette 1.0a26 Simon Willison's Weblog
<p><strong>Release:</strong> <a href="https://github.com/simonw/datasette/releases/tag/1.0a26">datasette 1.0a26</a></p> <p>Datasette now has a mechanism for assigning semantic column types. Built-in column types include <code>url</code>, <code>email</code>, and <code>json</code>, and plugins can register additional types using the new <a href="https://docs.datasette.io/en/latest/plugin_hooks.html#plugin-register-co...
6日前

GlassWorm Sleeper Extensions Activate on Open VSX, Shift to GitHub-Hosted VSIX Malware
Socket
We identified over 20 additional malicious extensions, along with over 20 related sleeper extensions, some of which have already been weaponized.
6日前

Snowflake Cortex AI Escapes Sandbox and Executes Malware Simon Willison's Weblog
<p><strong><a href="https://www.promptarmor.com/resources/snowflake-ai-escapes-sandbox-and-executes-malware">Snowflake Cortex AI Escapes Sandbox and Executes Malware</a></strong></p>PromptArmor report on a prompt injection attack chain in Snowflake's <a href="https://docs.snowflake.com/en/user-guide/snowflake-cortex/cortex-agents">Cortex Agent</a>, now fixed.</p><p>The attack started when a Cortex user asked the agent to review a GitHu...
6日前

Node.js互換でコンテナよりも高密度と高速起動を実現する「Edge.js」、Wasmerが発表
Publickey
WebAssemblyランタイム「Wasmer」を開発提供するWasmer社は、Node.js互換かつコンテナよりも高密度な集約と高速起動を実現する「[Edge.js](https://edgejs.org/)」を発表しました。 What ...
6日前
3/18 (水)

What Is the PARK Stack?
Radar
Background: Stacks with four-letter acronyms According to Wikipedia, the LAMP stack was coined in 1998 by Michael Kunze to describe what had emerged as a popular open source software stack for websites. When the World Wide Web exploded in popularity earlier in the ’90s, organizations used an ad hoc mixture of proprietary tools and operating […]
6日前

LINEヤフーのエンジニアの動向を知る:State of LY 2025実施レポート LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフーでは、2024年に引き続き、2025年も社内の開発者を対象としたアンケート「State of LY 2025」を実施しました(昨年度の実施レポート)。昨年はWebフロントエンド開発者のみ...
6日前

LINE iOSアプリにWebKitの新API「WebPage」を導入できず、自前で実装した件 LINEヤフー Tech Blog (LY Corporation Tech Blog
はじめにこんにちは、iOSアプリエンジニアのKiichiです。LINE iOSアプリでアプリ内ブラウザなど、Webまわりの開発を担当しています。普段はUIKitをベースに機能改善や新機能開発を進めつつ...
7日前

cdk8s の Helm 実行結果をキャッシュしてマニフェスト生成を高速化した
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone 生成 AI チームで連載中の kintone AI リレーブログ 2026 の 10 本目の記事です。リレーブログでは生成 AI チームのメンバーが AI トピックに限らず、さまざまなことについて発信していきます。こんにちは! kintone の生成 AI チームでソフトウェアエンジニアをやっている福田です。私たちのチームでは cdk8s を使って Kubernetes マニフェストを管理しています。(cdk8s の詳細は別の記事で紹介していますので、あわせてご覧ください。)cdk8s を使うと TypeScript でマニフェストが書けるだけでなく、Helm チャートと統合したマニフェスト管理も簡単に行うことができて非常に便利なのですが、YAML のマニフェスト生成に時間がかかることがチーム内でも問題になっていました。Kubernetes へのデプロイは、cdk8s で生成した YAML のマニフェストを apply するという方法で行っており、その生成に時間がかかってしまうと、開発のイテレーションが遅くなってしまいます。今回はマニフェスト生成が遅いという
7日前

2026年4月の技術系イベント予定
LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...
7日前

Nemotron 3 Nano 4Bを試す。Qwen3.5やQwen3のほうがいいかも
きしだのHatena
Nemotron 3 Nano 4Bというのが出ていたので、Q8_0で試してみます。 Nemotron 3 Nano 4B: A Compact Hybrid Model for Efficient Local AI 結論でいうと、Qwen3-4BやQwen3.5-4Bよりいい点はあまり見当たりませんでした。 知識カットオフは? 2024-6っぽいけど、なかなか・・・ 「きしだ」というのはあってそうだけど、 Qwen3.5-4Bは、石破さんは102代だけどだいたいあってて、知識も新しい。 Qwen3-4Bは読み方以外は正しい。知識はちょい古い。 日本知識 どこのことを言ってる? Qwen3.5…
7日前

Sansanのデータ化オペレーションを支えるデータ基盤hydra
Sansan Tech Blog
技術本部Digitization部Platform Engineeringグループの湯村です。Sansanでは、名刺や請求書などの情報を正確なデータへ変換するために、AIによる自動処理と人による補正を組み合わせた大規模な運用体制を構築しています。この記事では、こうしたデータ化の運用を拡大する中で直面した課題と、それを解決するために構築したデータ基盤hydraの設計について紹介します。
7日前

「自分でやり切る」だけでチームは強くならない
NTT docomo Business Engineers' Blog
NTTドコモビジネス イノベーションセンター テクノロジー部門 MetemcyberPJでの経験を通じ、私は「自分でやり切ること」と「チームとして成果を出すこと」のバランスの重要性を学びました。若手社員でも幅広い業務に挑戦できる環境の中で、責任感を持ちながらも周囲と協力することで、個人の成長とチーム成果の両立が可能であると実感しています。この記事では、その経験から得た学びと実践のポイントを紹介します。 はじめに 若手でも幅広く挑戦できる環境 スクラムという前提 私が経験した「抱え込み」 タスクの優先順位のつけ方 最後に はじめに こんにちは。イノベーションセンター テクノロジー部門 Metem…
7日前

40,000行のAPIテスト作成で学んだClaude Code Skillsの育て方
カミナシ エンジニアブログ
こんにちは、ソフトウェアエンジニアの渡邉(匠)です。「カミナシ 設備保全」の開発に携わっています。 Claude CodeのSkills(以下スキル)を使い、約2週間で40,000行超のAPIシナリオテストを書き切りました。最初のスキルは粗削りでしたが、テストを量産する中で繰り返し改善した結果、後半は「スキル実行 → レビュー → マージ」のサイクルだけで回せるようになりました。 この記事では、スキルをどう設計し、どう育てたかを中心にお伝えします。 背景 APIの動作保証にシナリオテストツール runn を使っていました。 サービス成長に伴うAPIの増加により、当初のテスト構成では運用が回らな…
7日前

Quoting Ken Jin Simon Willison's Weblog
<blockquote cite="https://fidget-spinner.github.io/posts/jit-on-track.html"><p>Great news—we’ve hit our (very modest) performance goals for the CPython JIT over a year early for macOS AArch64, and a few months early for x86_64 Linux. The 3.15 alpha JIT is about <strong>11-12%</strong> faster on macOS AArch64 than the tail calling interpreter, and <strong>5-6%</strong>faster than the standard interpreter on x86_64 Linux.</p></blockquote><p class...
7日前

GPT-5.4 mini and GPT-5.4 nano, which can describe 76,000 photos for $52 Simon Willison's Weblog
<p>OpenAI today: <a href="https://openai.com/index/introducing-gpt-5-4-mini-and-nano/">Introducing GPT‑5.4 mini and nano</a>. These models join GPT-5.4 which was released <a href="https://openai.com/index/introducing-gpt-5-4/">two weeks ago</a>.</p><p>OpenAI's self-reported benchmarks show the new 5.4-nano out-performing their previous GPT-5 mini model when run at maximum reasoning effort. The new mini is also 2x faster than the previous mini.</p>...
7日前

llm 0.29 Simon Willison's Weblog
<p><strong>Release:</strong> <a href="https://github.com/simonw/llm/releases/tag/0.29">llm 0.29</a></p> <p>Adds support for OpenAI's new models <code>gpt-5.4</code>, <code>gpt-5.4-mini</code>, and <code>gpt-5.4-nano</code>.</p>
7日前

Improving breast cancer screening workflows with machine learning
The latest research from Google
Health & Bioscience
7日前

Quoting Tim Schilling Simon Willison's Weblog
<blockquote cite="https://www.better-simple.com/django/2026/03/16/give-django-your-time-and-money/"><p>If you do not understand the ticket, if you do not understand the solution, or if you do not understand the feedback on your PR, then your use of LLM is hurting Django as a whole. [...]</p><p>For a reviewer, it’s demoralizing to communicate with a facade of a human.</p><p>This is because contributing to open source, especially Django, is a communal endeavor....
7日前

JavaにJavaScriptエンジン「V8」とPythonランタイム「CPython」を組み込む「Project Detroit」、オラクルが発表
Publickey
オラクルは、カリフォルニア州レッドウッドシティで開幕したイベント「JavaOne 2026」で、「Project Detroit」(以下、Detroit)をOpenJDKのプロジェクトプロポーザル(プロジェクト提案)として発表しました。 D...
7日前





