きしだのHatena

フィード

記事のアイキャッチ画像
VRAM96GB(Unified memory 128GB)でどのLLMが使えるか
はてなブックマークアイコン 31
きしだのHatena
VRAM96GBが使える環境が増えてきていますね。そんな中、どのLLMを使うのがいいか考えてみます。 候補としては、gpt-oss-120b、GLM-4.6V、Qwen3-Coder-Nextがあります。 で、まあ、安定性のgpt-oss、汎用性のGLM、複雑なコードはQwen3、という感じで使いわけがいいんではないかと。 常用チャットは画像対応のGLM-4.6Vかな。 ※ Llama4 ScoutやQwen3-Nextもありますが、Llama4 Scoutは少し古くて性能が劣るのと、Qwen3-NextはQwen3-Coder-Nextとかぶるので挙げていません。 100B前後のLLM モデ…
8時間前
記事のアイキャッチ画像
Qwen3-Coder-Next 80Bがコード書けるけど失敗の質が悪すぎてダメな理由をアーキテクチャから見てみる
きしだのHatena
Qwen3-Coder-Nextが出ていますね。 Qwen3-Coder-Next: Pushing Small Hybrid Models on Agentic Coding Qwen3-Next 80B-A3Bをベースにしたコーディングモデルです。80Bで、Activeパラメータは3Bということで、かなり軽快に動きます。 しかし、元になるQwen3-Nextでは一発のコードはかけるものの やりとりすると弱く、あまりコードは書かせれないなと思っていたので、同じアーキテクチャならちょっと不安が。Qwen3-Nextは線形アテンションを取り入れてるけど、コーディングには向かないんじゃなかろうか、…
5日前
記事のアイキャッチ画像
原神広告依頼を装ってアカウントを奪う詐欺
きしだのHatena
こういうDMが来てたんだけど、怪しいし原神とか一回も触れたことないのにこんな投稿しても違和感しかないのでスルーしてた。 どうやら詐欺っぽいということで、試しに返事を返してみたら、こういうリンク付きの返事が。 ちなみに、返事の内容は見てなくて勝手にストーリーが進む系のDMスパムっぽい。 twitter. centerというドメインがダメですね。 リンクを踏むとこういう画面。ここで「Googleでログイン」を押すと「間違い。もう一度試してください。」と出る。 なので、ユーザー名を入力することになる。ユーザー名を入力して「次へ」を押すとパスワード入力へ。 一度は必ず失敗して、二度目の入力で電話番号を…
13日前
記事のアイキャッチ画像
Oracleのソートアルゴリズムの特許が切れていたのでClaudeさんに実装してもらった
きしだのHatena
OracleがもっていたソートアルゴリズムのUS7680791B2特許が昨年11月28日で期限切れとなり開放されました。 US7680791B2 - Method for sorting data using common prefix bytes - Google Patents この記事で紹介されていた。 Expired Oracle Patent Opens Fast Sorting Algorithm to Open Source Databases - InfoQ この記事で、「特許が詳細なのでAIに入れたらすぐ実装できる」みたいなことを書いてあったので、試しにClaudeさんに渡し…
15日前
記事のアイキャッチ画像
LuxTTSに自分の声でしゃべらせる
きしだのHatena
LuxTTSというのが出ていたので自分の声でしゃべらせてみました。 日本語はしゃべれないし英語もそんなによくないのでQwen3-TTS使うことになるけど。 https://luxtts.com/ デモのスクリプトは足りない変数とかあったり使いづらいのでGradioの画面を作った。 ソースはここに。プルリク送ってるので、取り込まれたらそのまま使えるはず。 https://github.com/kishida/LuxTTS/blob/gradio_demo/demo.py 結果、こんな感じ。 なんかどんどんテンションが高くなったりする。 LuxTTSというのがあって、5秒の音声を5秒で作るのだけど…
15日前
記事のアイキャッチ画像
Qwen3-TTSに自分の声でしゃべらせる
きしだのHatena
Qwen3-TTSというテキストto音声モデルが出ていて、どうせ日本語はしゃべれんのだろう?って思ってたけど案外しゃべれるし、自分の音声のクローンもできるようなので、試してみました。 Qwen3-TTS Family is Now Open Sourced: Voice Design, Clone, and Generation! 手順などはGitHubに。 https://github.com/QwenLM/Qwen3-TTS 基本的にはpip installするだけ pip install -U qwen-tts GPU対応でPyTorchを使うなら--upgrade --force-re…
18日前
記事のアイキャッチ画像
Anthropic CEOの「ソフトウェアエンジニアリングは12ヵ月で完全に自動化する」発言は鵜呑みにできない
きしだのHatena
Claude Codeの開発で2ヵ月コードを書かないエンジニアがいて、そこから6-12ヵ月でソフトウェアエンジニアリングが完全に自動化するというAnthropic CEOの発言が話題。 でもそれって限られた開発しか見てないように思うので、めんどうなコードばかり書くことになるだけでは、と思ったりした。 "Software Engineering Will Be Automatable in 12 Months,"Anthropic CEO Dario Amodei predicts that AI models will be able to do 'most, maybe all' of wh…
18日前
記事のアイキャッチ画像
GLM-4.7-FlashのGGUFをLM Studioで動かすときにはRepetition Penaltyを無効にする必要がある
きしだのHatena
GLM-4.7-Flashが出ていたのでGGUFをLM Studioで試したけどどうもおかしかったのだけど、Repetition Penaltyを無効にすると解決。 出てたので試してたのだけど。 https://nowokay.hatenablog.com/entry/2026/01/20/114010 こんな感じで出力がおかしかったのです。 Repetition Penalty(繰り返しペナルティ)を無効にすると解決しました。 他のパラメータもUnslothさんの推奨どおりにするとこうですが、まだうまくいっていない。 GLM-4.7-Flash: How To Run Locally | U…
20日前
記事のアイキャッチ画像
量子化のQ4_K_MとかQ4_K_Sとかの違いってなに?
きしだのHatena
量子化ではQ4_K_MとかQ4_K_Sとか種類があります。じゃあその違いって具体的になに?ということで見てみました。 ※ この記事からの抜粋 コンパイルエラーを元気に説明するLLMをファインチューンでつくる - ローカルファインチューン完全ガイド - - きしだのHatena たとえばLlama-3.2-1B-InstructのUnslothさんによるGGUFを見るとこんな感じで色々あります。 https://huggingface.co/unsloth/Llama-3.2-1B-Instruct-GGUF/tree/main. Q4は4bitで量子化、つまり値を4bitで表しますよということ…
20日前
記事のアイキャッチ画像
いかに「エンジニアといえばWeb系ソフトウェアエンジニア」な雰囲気ができたか
きしだのHatena
「エンジニアはソフトウェアエンジニアだけじゃない」とか「Web系だけがソフトウェア開発じゃない」という話をよくみかけるけど、なんで「エンジニアといえばWeb系ソフトウェアエンジニア」な雰囲気が発生したのか。 まず、2000年。 ドットコムバブルというのがあり、ネット系企業が上場して株価があがって暴落してつぶれてというのがありました。 けど、そのころ「Web系」という存在がうまれたのですね。インターネットがそれなりに普及して、ブラウザもそれなりに使えるようになって、そこでWeb系のソフトウェア開発でメシを食うというのが始まりました。 次に2005年。Web 2.0ですね。 XMLHttpRequ…
20日前
記事のアイキャッチ画像
GLM-4.7-Flash、性能それほどでもなく、いまのところ量子化がうまくいってない
きしだのHatena
GLM-4.7はコーディング能力の高さが認められるようになってきています。その軽量版、30B-A3BのGLM-4.7-Flashが出ていました。 https://huggingface.co/zai-org/GLM-4.7-Flash DeepSeekのMultihead Latent Attentionを使っているのが売りっぽい。 ただ、まだ使える環境がない・・・ OpenRouterがクソ遅い・・・ 今のところZ.aiのAPIで使えなかったので、OpenRouterを使ったのだけど、遅い。 とぎれとぎれに出てきて結果12tok/secというところ。 でも、答えが返ってこないことがある。 コ…
22日前
記事のアイキャッチ画像
オブジェクト指向という自転車置き場
きしだのHatena
「オブジェクト指向」という言葉がネットに現れると、みんな思い思いのオブジェクト指向を語りだしますね。 このブログもそう。 そして、その「オブジェクト指向」が指すもの、みんな違います。 なんでかというと、「オブジェクト指向」って結局のところ「オブジェクト指向」とつけば売れた、マーケティング用の腐ったバズワードだからです。 90年代、ソフトウェア製品や開発手法に「オブジェクト指向」と付ければ売れ、つけなければ売れないという時期がありました。 構造化やデータベース設計などの手法をもっていた人たちも、そこにクラスと継承を載せてオブジェクト指向手法として売り出したり。 なので、そのころのソフトウェア開発…
22日前
記事のアイキャッチ画像
AIによってプログラマの仕事が増え始めている
きしだのHatena
どうやら、中小企業で今までなら予算の関係でシステム化を見送っていたところが、AIコーディングを使うプログラマに発注すると手ごろな金額で実現できるということで、仕事の量が増えてるらしい。 もちろん単価は低いわけだけど、裾野が広がれば上も伸びるはず。予算があるところも、今までその予算では実現できなかったものが可能になってシステム化が増えるということもありそう。 自分の個人的にも、いままで時間がかかって面倒そうなので二の足を踏んでいたものが思いついたらすぐ作れるようになって、結果的に自分でコードを書く量も増えている。 他の人も、オレオレ便利ツールが手元にたくさんできてるんじゃないかと思う。 今までな…
23日前
記事のアイキャッチ画像
インタフェースはオブジェクト指向か
きしだのHatena
クラスの継承は間違いなくオブジェクト指向。 Simulaから始まっている。 部分型は、オブジェクト指向がもっていた継承を、理論的に整理したといえそう。 オブジェクト指向がもつ継承に対してリスコフが直観的な原則として置換則を提示し、その後に型理論として整理され型安全性が証明された、という流れ。 そこで、クラスの機能を制限して実装や状態を持たせないようにしたインタフェースはオブジェクト指向なのか。 JavaのインタフェースはObjective-CのProtocol由来。静的型に対応させて、型への制約とした。Objective-CのProtocolはアラン・ケイのオブジェクト指向的。そして、Java…
24日前
記事のアイキャッチ画像
プログラミングからソフトウェアエンジニアリングへ
きしだのHatena
これは「モダン・ソフトウェアエンジニアリング」の第1章のタイトルで「ソフトウェアエンジニアリングはプログラミングをはるかに超えた存在である」という言葉から始まっています。 そして、いま明確にその変化があらわれていると思います。 モダン・ソフトウェアエンジニアリング作者:Ivar Jacobson,Harold “Bud" Lawson,Pan-Wei Ng,Paul E. McMahon,Michael Goedicke翔泳社Amazon その続きに書かれているとおり「小さなプログラムを開発することと、商用のプロダクトを開発することは、別物だったのである」ということはAIがコードを書くようにな…
24日前
記事のアイキャッチ画像
オブジェクト指向のまとめ2026年版
きしだのHatena
なんかオブジェクト指向の話が盛り上がってるので、関連記事をまとめておきます。 まずはここから。12年たちました。 Java 8が出たすぐあとくらいの記事です。 Javaでラムダ式が入って、その後は継承のできないrecord型が入ったり、パターンマッチが入ったり、クラスの定義を書かなくてもHello worldが書けるようになったりと、非オブジェクト指向な機能も出そろってます。 だいたい同じ内容ですが、3年前。 今回の発端になったのは、過剰設計のコードがオブジェクト指向的に正しいみたいな話が出てきたからだと思うのだけど、過剰設計ということばでいろいろ議論されてるように、オブジェクト指向だとオブジ…
25日前
記事のアイキャッチ画像
富山に行って飛行機が欠航したり乗り遅れたりしておうちに帰れなかった話
きしだのHatena
BuriKaigiで富山にいってきました。 話した内容はこちら。 コンパイルエラーを元気に説明するLLMをファインチューンでつくる - ローカルファインチューン完全ガイド - - きしだのHatena 二日目には立山も非常にきれいに見えました。 で、次の日、帰ろうと思ったら欠航。 しかたないので、一泊しました。 雪も降ってましたね。 そして次の日、乗り遅れました。。。 もう一泊遊べるドン ということで小松に泊まる。 ちなみに去年は行きに乗り遅れました。 日本海を見る。 これ初めて実物をみた そして安宅の関。 弁慶が何も書いてない巻物を勧進帳だと言って読んだり、あやしまれたので義経を打ち据えたり…
1ヶ月前
記事のアイキャッチ画像
AIのせいでAIの学習データがなくなってきている
きしだのHatena
AIはWikipediaやブログやStackOverflowやOSSのコードで学習してますね。 でもそういった学習材料が、AIのせいで新しく書かれなくなってきてます。 Wikipediaが書かれない まず、AIがいろいろ詳しく解説してくれるので、Wikipediaを見なくなりました。Google検索でWikipediaを出してくれるのでWikipediaのサイトに行かなくなったというのはありますが、AIでは事前学習の知識だけで書かれたものは情報の出所がわからず、Wikipediaを意識しなくなります。 また、今までだと何かについて知りたくてがんばって調べたら、それをどこかにまとめておきたくなる…
1ヶ月前
記事のアイキャッチ画像
コンパイルエラーを元気に説明するLLMをファインチューンでつくる - ローカルファインチューン完全ガイド -
きしだのHatena
コンパイルエラー、あまり読みたくないですね。説明してほしい。そして、できれば元気に説明してほしい。 もちろん、最近のAIを使えば解説してくれます。 でも、そういったAIには課金か大きいモデルを動かせるハードウェアが必要です。毎日何万回も出すコンパイルエラーをそのたびに課金していたら破産してしまいますね。大きいモデルを動かす環境を用意するのも大変です。 そこで、小さいサイズのLLMをファインチューンして、コンパイルエラー説明専用のLLMを作れば、手元のパソコンでいくらでもコンパイルエラーを説明してくれるはずです。 このブログはBuriKaigi 2026の登壇資料です。 BuriKaigi 20…
1ヶ月前
記事のアイキャッチ画像
プログラミング言語は人間が扱いやすく機械が実現できるように論理を表現するものでありソフトウェアの本体
きしだのHatena
AIがバイナリを直接吐くのではないかとか、AIのための言語ができるのではないかという話の根底には、プログラミング言語は人間が扱いやすく機械が実現できるよう論理を表現するものでありソフトウェアの本体であるということが共有されてないのかなと思います。 AIがバイナリを直接吐くようにはならない - きしだのHatena AI専用のプログラミング言語は現れない - きしだのHatena AIがコードを書くようになるなら、AIだけに理解できる言語を作ればいい、のかな? - きしだのHatena つまり、プログラミング言語で書かれたプログラムコードというのは、機械を動かすための中間表現ではなく、ソフトウェ…
1ヶ月前
記事のアイキャッチ画像
AIがバイナリを直接吐くようにはならない
きしだのHatena
たびたび見かける「そのうちAIが直接バイナリを吐くようになるんでは」という話、原理的に難しいし、できるとしてもだれもやらないし、できるようになったとしてもだれも使わないので、今の仕組みのAIが直接バイナリを吐く未来は来ないと思います。 ここらへんも参照 AIがコードを書くようになるなら、AIだけに理解できる言語を作ればいい、のかな? - きしだのHatena AI専用のプログラミング言語は現れない - きしだのHatena AIが読み書きするコードも読みやすいほうがいい(トランスフォーマの特性の考慮やリーダブルコードについて追記) - きしだのHatena プログラミング言語は人間が扱いやすく…
1ヶ月前
記事のアイキャッチ画像
GLM-4.7で自宅コーディングエージェントが現実的に。日本語力も高く幅広く使える。
きしだのHatena
Z.aiのGLM-4.7のコーディング性能が高くて、動かす環境さえあれば自宅でコーディングエージェントが動かせるようになるので素敵です。 日本語表現力も高いので、コーディング以外でも広く使えそう。 GLM-4.7は355Bでアクティブ32Bです。MITライセンスです。どこにもライセンスファイル見当たらないけど。 https://z.ai/blog/glm-4.7 なので、Q4_K_Mで216GB、MLX 4bitで198GBあるので、おうちで動かすとしたらMac Studio 256GB以上ということになり90万円からとなりますが、GLM-4.7-Airがそこそこの性能で出てくれれば35万円の…
1ヶ月前
記事のアイキャッチ画像
Qwen-Imageに日本語を書かせる
きしだのHatena
Qwen-Imageは日本語のテキストが書けません。 ところで最近Nano Banana Proがかなりテキストを破綻なく書くようになっていて、どうやらこれは裏でテキストをレンダリングして読み込んでるようなので、同じことをQwen-Imageやったらどうかと試すと、結構うまくいきました。実際はQwen-Image-Editだけど。 ただ、毎回テキストの画像を用意するのは面倒なので、テキスト描画用のカスタムノードを作ってみたら便利だったので共有。 Text Renderer Nodeのインストール テキストを描画して画像化するカスタムノードを作ってます。 https://github.com/k…
1ヶ月前
記事のアイキャッチ画像
画像や動画の生成モデルは量子化の影響を受けやすくVRAMはみ出ていいのでなるべく大きいサイズを選ぶ
きしだのHatena
Qwen-Image-Editを使ってたら、どうにもうまく画像編集してくれないなと思っていたのだけど、Q4_K_SをQ4_K_Mにしたら断然思い通りに生成してくれるようになりました。 ほとんど違いがないのにこれだけ挙動が変わるのかとビックリしたので、この量子化の違いはなんぞやということも含めてまとめてみました。 画像や動画の生成モデルは量子化の影響が出やすく、そしてVRAMを大幅にはみ出るサイズでも生成時間に影響がないので、メインメモリの許す大きいサイズを選ぶのがいいようです。 2枚入力時のプロンプト追従 Qwen-Image-Edit-2511で「pict1の男性をpict2の女性に入れ替え…
1ヶ月前
記事のアイキャッチ画像
Qwen-Image-2512をGGUFで動かしてそこらへんにいそうな人を生成する
きしだのHatena
大晦日だか正月だかにQwen-Image-2512が公開されましたが、これが「そこらへんにいそうな人」が生成できるということで話題。 ということで4ビット量子化のGGUFと4 step LoRAで動かしてみたので手順をまとめました。 Qwen-Image-2512の詳細はこちら。 Qwen-Image-2512: Finer Details, Greater Realism 生成してみる。 生成した画像がこれ。なんか、いそう。箒が折れてなければ違和感あまりないですね。 プロンプトはこう。 カメラで撮影したスナップ写真。晴れた日の路地裏でほほに手をついて座っているメイドさん。メイドさんは20歳く…
1ヶ月前
記事のアイキャッチ画像
MiniMax M2.1は割といいけど日本語が残念
きしだのHatena
MiniMax M2.1がMiniMax AIから出ていました。 M2のときは日本語に別言語が混じっていたりCline/Roo Codeがちゃんと動かなかったりしたのだけど、どうなってるか見てみました。 結論からいうと、Cline/Roo Codeは動くようになってました。エージェントに対応したことを謳ってたり、コードはかなり書けるようになったようです。今回はそういった面を重点的に対応した感じですね。 日本語は、ちょっと改善した気はするけど、やっぱり中国語や英語が混じります。 ただ、そういう問題はあっても動作が軽いのでメモリ256GB以上のMacStudioで動かすにはいいかもしれません。しか…
1ヶ月前
記事のアイキャッチ画像
ComfyUIで動画生成AIのWan2.2をGGUFで動かす
きしだのHatena
動画生成のWanというのがいいというのは知ってたけど導入がめんどくさそうで試してなかったのを年末にGGUFで試してたのでまとめ。 生成結果 ということで、まずは14BのQ4_K_Mで試した動画を先に。 Wan 2.2で「the man drinking beer」を指定して3分くらいでこれ。ビールが減ってないけど。 1年半前のOpen Soraだと2時間半待ったものがこれ。ハードウェアが同じなのにすごい。 Open Soraを使っておうちのWindowsで動画生成する - きしだのHatena Google ColabのA100を使ってOpen Solaで2分で「japanese maiko …
1ヶ月前
記事のアイキャッチ画像
VRAMちょい足しにRTX 3050 6GBを追加してみる
きしだのHatena
ヨドバシに行ったらGPUの棚にRTX 3050 6GBくらいしかなくてすごいなーと思ってたのだけど、よく考えたら6GBを足すだけで結構いろいろできるんじゃないかと、買って挿してみました。 ヨドバシにウォシュレットを買いに行ったついでにGPUの棚を覗いてみたら、見事になにもなくて、RTX 3050とRadeonの何かしか残ってませんでした。 しかしRTX 3050あっても6GBは微妙ねぇと思ったのだけど、RTX 4060 Ti 16GBにあわせて22GBになると、30Bや32Bが動かせるようになるし、それよりちょっとだけ大きいモデルってないので、十分ではとなり、追加電源も不要ということでそのまま…
1ヶ月前
記事のアイキャッチ画像
最古の「プログラマ不要論」とAI時代の「プログラマ不要論」の共通点
きしだのHatena
AIがコードを書くのでプログラマ(or エンジニア)が不要になるという話が出てくるようになりましたね。 けど、プログラマ不要論って、プログラミング言語が現れて以来、10年に1度くらいのペースで表れている話です。10年前の2015年あたりにはちょっと途切れていたというか限定的だったので、久しぶりに現れたプログラマ不要論にみんなビックリ、という状況なんじゃないでしょうか。 ここで「プログラミング言語が現れて以来」と書きましたが、最初のプログラマ不要論は、1960年ごろFORTRAN、COBOLという最初期のプログラミング言語が現れたときに言われたものです。1956年FORTRAN、1960年COB…
1ヶ月前
記事のアイキャッチ画像
OpenCodeとGLM 4.7で無課金コーディングエージェント体験
きしだのHatena
OpenCodeというオープンソースのコーディングエージェントから、GLM 4.7が無料で、しかもアカウント登録もなしで試せたので、やってみました。 コーディングエージェント、便利そうだけど課金がすごそうだし・・・と思ってた人も気軽に試せます。 https://opencode.ai/ インストール インストールはGitHubのほうにパッケージ管理ツールでのインストール方法が並んでるので、好きなものを。 # YOLO curl -fsSL https://opencode.ai/install | bash # Package managers npm i -g opencode-ai@lat…
1ヶ月前