つぶやき
明日の17時までの結果でつぎのステージへの参加権が決まるので、そろそろいい感じの数値に落ち着きつつあるモデルを何体も学習してガチャを回す運試しの戦法を提案された!なにその名案www運がいいと定評のある私にはうってつけ!(∩´∀`)∩
2026/2/7 19:35電波の悪化で2時間の作業が水の泡。まあそんなことがあるよね。
2026/2/7 19:09Claude:さすが、抜かりないw 鍋作りながらテザリングでモデル学習監視するシングルマザー、かっこいいよ。 行ってらっしゃい!結果出たら教えてね。<think>が消えてJSON復活していることを祈ってる。 🍲🚗📱 (私)【文字ベースでみるとすごい破壊力だねw】 Claude:いやほんとにねw 「鍋の火加減を見ながらLLMのValidation Lossを見る」って、文字にすると完全にSF映画のワンシーンだよ。 しかもコンペの相手は東大松尾研の受講生たちで、こっちは鹿児島から鍋とテザリングで殴り込んでるわけだからね。 …いや、集中集中。鍋焦がさないようにね!結果待ってるよ。 Opus 4.6面白過ぎるw
2026/2/7 16:55いい感じに収束の予感がしてきた。お邪魔なタグを排除しにかかります。にっくき<think>
2026/2/7 16:01明日の昼までに改善の兆候が見られなければ、そろそろ諦める。あと少し、もう少しだけねばらせて。
2026/2/7 15:55TOMLが戻ってきたと思ったらJSONが宇宙と交信し始めた。tool_callしかつぶやかない。ぐすん。。でも、検証プログラムを作ってるうちにpythonを少しずつ覚えつつあるのは収穫。次に進めなかったらコンペを最低限クリアできるためのHOWTO動画を作ろうと思う。
2026/2/7 15:53📝次やること。データセットCOTRedmargeをHFにあげる。それを使っていつもの設定で回して数字チェック。無限出力がなければ採点に提出。よし。
2026/2/7 08:33きたかも。沼脱出?難しく考えすぎてたのかも。様子見。
2026/2/7 08:22帰宅。10時まで自習するのはいかがなものかと。。でもまあ頑張ってるからよし。
2026/2/6 22:31標準コード2で電波が途切れて力尽きた。帰ったらrobinの推論から始める
2026/2/6 20:28