水先案内人@江戸川's Avatar

水先案内人@江戸川

@vbkaisetsu.bsky.social

Rust🦀で自然言語処理してる人←医療系IT会社←アニメ制作会社←NAIST 🇺🇦戦争反対🇵🇸

57 Followers  |  43 Following  |  56 Posts  |  Joined: 25.07.2023  |  1.862

Latest posts by vbkaisetsu.bsky.social on Bluesky

Preview
LLMを活用したアノテーション基準書作成支援|シェルパ・アンド・カンパニー株式会社 はじめに シェルパ・アンド・カンパニー株式会社 AI事業部の赤部です。 今回は、社内で開発・使用しているアノテーション基準書作成支援ツールを紹介します。 シェルパでは、企業が投資家向けに開示している非財務情報(ESG情報)を分析し、開示内容の改善支援を行なうSmartESGというサービスを開発しています。ESGはEnvironment (環境), Social (社会), Governance ...

アノテーション基準書の作成をLLMで支援する取り組みについて記事を書きました。
note.com/cierpa_and_c...

18.12.2024 09:10 — 👍 5    🔁 0    💬 0    📌 0

PDFがほぼテキストデータ(streamを除く)ということはあまり知られてないのかな

02.11.2023 04:53 — 👍 0    🔁 0    💬 0    📌 0
Post image Post image Post image

今週は草津温泉に来てる

14.10.2023 04:11 — 👍 2    🔁 0    💬 0    📌 0

大言壮語ですが、中学入学したときの国語のテストでビリ2位だった私も国語研の共同研究員なので、人生何があるか分かりませんね

14.10.2023 00:48 — 👍 3    🔁 0    💬 0    📌 0
Post image Post image Post image Post image

加賀屋に来てる

30.09.2023 08:59 — 👍 4    🔁 0    💬 0    📌 0

:q という名前のファイルができてた

27.09.2023 06:33 — 👍 3    🔁 0    💬 0    📌 0

デバイスドライバはRustで書く時代ですが、daachorseもtrie-matchも#![no_std]で動く(trie-matchはallocすら要らない)のでよろしくお願いします github.com/daac-tools/t...

22.09.2023 11:17 — 👍 0    🔁 0    💬 0    📌 0

FizzBuzz書いてくださいと言われたら、「出力先は普通のファイルですか」とか、「1行ごとにflushする必要はありますか」とか質問しそう

21.09.2023 02:01 — 👍 0    🔁 0    💬 0    📌 0

中国語の簡繁変換ライブラリでdaachorseを使われてる github.com/Gowee/zhconv...

20.09.2023 00:38 — 👍 1    🔁 0    💬 0    📌 0

KyTeaのページで配布されてる中国語モデルがバグってる?

19.09.2023 16:38 — 👍 0    🔁 0    💬 0    📌 0

Rustでコードをめちゃめちゃ書き換える系のproc_macro、他のマクロや属性との相性が悪い...

16.09.2023 12:15 — 👍 0    🔁 0    💬 0    📌 0
Post image Post image

Rustのmatch式を高速化するtrie_matchというマクロを作りました。最適化のされ方にもよりますが、手元のベンチマークで2倍から3倍高速化されます。マクロが展開されると、図のようなダブル配列が埋め込まれます github.com/daac-tools/t...

12.09.2023 11:54 — 👍 1    🔁 0    💬 0    📌 1

読んだ本で優秀か優秀でないかの判別ができるなら苦労しない

10.09.2023 12:23 — 👍 1    🔁 0    💬 0    📌 0

例外を戻り値のように使うのは大変よろしくない

08.09.2023 16:01 — 👍 0    🔁 0    💬 0    📌 0

mypy使用環境下ではコーディング規約で例外を使用禁止にすべきなのでは

08.09.2023 15:56 — 👍 0    🔁 0    💬 1    📌 0
Post image

もはやただのチャットツールで草

06.09.2023 13:40 — 👍 0    🔁 0    💬 0    📌 0

異文化圏においてはTera Termは定番の端末エミュレーターらしい()

06.09.2023 13:23 — 👍 0    🔁 0    💬 0    📌 0

Tera Termとかいう聞いたこともない()ソフトの名前が飛び交っていて、文化圏の違いを感じている

06.09.2023 13:21 — 👍 0    🔁 0    💬 0    📌 0

telnetコマンドはインターネット覚えたての頃使いまくってた

05.09.2023 01:32 — 👍 0    🔁 0    💬 0    📌 0

Rustのunsafe関数の内側で引数をdebug_assertしているコードを見たが、unsafe関数は引数が定義域に収まっていることを前提とすべきで、その保証は関数の外側で行うべきなので、関数の内側でdebug_assertしてはいけないのでは。

04.09.2023 12:32 — 👍 1    🔁 0    💬 0    📌 0

マクロでも作ったほうがいいかもしれない
conditional_method_chain( $x, $cond, $method ) => { if $cond { $x.$method() } else { $x } }
みたいな感じで

02.09.2023 13:49 — 👍 0    🔁 0    💬 1    📌 0

(緩募)Rustで、メソッドチェーンで設定を追加していく構造体で、条件に応じて呼び出すメソッドを変更する処理を簡潔に書きたい。例えば
let x = A::builder().use_foo().use_bar().build();
で、条件に応じてuse_foo()やuse_bar()を呼ぶが、mut変数とかは使いたくない

02.09.2023 11:42 — 👍 0    🔁 0    💬 1    📌 0
Post image

先日撮ったレシートのサンプル(日本語と英語とタイ語が混ざってる)

01.09.2023 03:37 — 👍 0    🔁 0    💬 0    📌 0

JVMを使っている以上、immutableをちゃんと扱うことは不可能なのでは。Clojure (Lispの方言) くらい吹っ切れれば話は別だが。

31.08.2023 10:52 — 👍 0    🔁 0    💬 0    📌 0

YANSの会場が自宅から電車1本で10分くらいで着くの楽すぎる

30.08.2023 00:23 — 👍 1    🔁 0    💬 0    📌 0

Web関連技術を検索したときにMDNしか表示されないようにしてほしいと思ったが、最初からMDNの中で検索すればよかった

27.08.2023 09:50 — 👍 0    🔁 0    💬 0    📌 0

久しぶりにCSS書いてる。CSS何もわからん

27.08.2023 09:47 — 👍 2    🔁 0    💬 0    📌 0

意見が別れるところではあるので、わざわざオープンソースなどと一括りに言わずにCC BY-SAというライセンス名を言っておくのが無難でしょうね。

25.08.2023 23:51 — 👍 0    🔁 0    💬 1    📌 0

同様の誤解はよく見るので、ホワイトハウスのそのissueは周知されてほしい

25.08.2023 23:25 — 👍 0    🔁 0    💬 1    📌 0

まずOSI Approved Licensesが公開されている目的は、下のURLに書かれているような問題を解決することなので、ここに載っていないものがOSIから適合しないと判断されたわけではないです。
opensource.org/proliferatio...
オープンソースライセンスの判断基準はDFSGからフォークされた「オープンソースの定義」で、CC BY-SA 4.0はこの基準を満たしていると思います

25.08.2023 15:16 — 👍 0    🔁 0    💬 1    📌 0

@vbkaisetsu is following 20 prominent accounts