うp主が動画内で寄せられたコメント(コメ番900ぐらいまで)に反応するよ。コメ番900ぐらい以降は掲示板で反応しています。
- >テキストファイルくれ
-
大百科の権利ってだいじょうぶなの?グニャラさんに怒られない?そんなわけで今は控えさせてもらってます。(しかも連休中なので実家に帰っててモノが手元にないんですよね。)→権利的にまずそうなので自重させてください。 - >長音は「―」→「ー」
- ちゃんとダッシュではなく長音記号になっているようです。そう見えるフォントを使っちゃったようです。(あずきフォント)
- >結構読みが正しくない記事もあるんだけどなー
- 「5月3日のエア本信仰祭を中止せよ!」とか「我輩はタコである。理由は未だ無い。」とかですね。ニコニコ大百科なら仕方ないね。笑っちゃうし。むしろもっとやれ。変換はあきらめる。
- >SoruceForgeプリーズ
- そんな大それた…。即休眠プロジェクト行きですよ。
- (博霊霊夢問題に対して) >これも学習機能でいいじゃん
- 単なる同音異義語だと無視すれば害はないんですが、気づきにくい誤字だとそのまま使い続ける可能性もありそうなので、同音異義語より問題視しています。実際、うp主は動画作る段で「博麗霊夢」っていう名前を知ったので、「博霊霊夢」になってるのを動画制作途中まで気づきませんでした。
- (博霊霊夢問題に対して) >リダイレクト元と先で、読みが同じ単語を無視するとか
- …! その発想はなかった。
- (変換結果に対して) >smooooch・∀・を変換させる方がおかしいと思う
- ああ、まったくですね。まあ、極端な例ってことで。
- >ATOKで
- >anthyでもできないかなwww
- >SKK用の辞書ならかなり使えそう
- ほかのIMEでってところまではまだ何も考えてません。
- >ATOKのRubyスクリプトとか使うのかと
- ATOKダイレクトってあるんですね。入力した言葉の大百科記事にアクセスする、とかできるんでしょうか。なんかおもしろそうですね。ATOK持ってないけど。
- >SocialIMEで
- >SocialIME余裕でした
- 存在は知っているのですが、ちょっと使ってすぐ止めちゃったです(変換結果がネットに流れるとか聞いて躊躇してしまったです)。情報の生成元が不特定多数のユーザであるという点では同じですが、システムとしてできあがってる点とか対象範囲がずっと広いという意味では向こうの方がずっと良さそうに見えますね。
- >不必要そうなのは手動で消していくしかないような…
- 手動は精度は高いんですけどコスト(人的資源)もかかりますよね。特にネットの言葉は普通の日本語に比べて流行り廃りが激しいので、継続的なメンテが必要になってしまいます。なので、統計量(記事をタグとして登録している動画数が少ない用語は重要でないと見なす)とかルールによるフィルタリング(「の一覧」で終わる言葉は捨てる、など)とか機械で何とかできるとうれしいかなあ、と思ってます。
- タグ「ニコニコIME」登録
- 語呂はいいですけど、作ってるのはIMEではないような…。うp主はWikipedia→Wiktionaryに倣って、Nico Nico Pedia→Nictionaryと心の中で呼んでいました。
- >三文字は@無しのほうがいいと思うが
- 最初は2文字以下にしたのですが、「きょう」が「今日」にならなかったのにイラっときて3文字に広げました。1音節が目安でしょうか。
- >結果よくなったのか悪くなったのか
- 変換効率への悪影響は最小限に、新たな言葉を覚えさせることはある程度できたのかな、と。ただ、これでは主観的な印象でしかないので、ちゃんと学術的な段取りをとるなら客観的に評価できる基準が必須になるんでしょうね…
- >これつかう?w
- うp主が使ってみています。
- (誤変換に対して) >項目に対するレス数、記事数で下位のものを切り捨てるとかは?
- >大百科観覧数とか掲示板投稿数とかで分けられないかな
- そのあたりも統計量のひとつになりそうですね。ただ、的確に言葉の重要度を表しているモノなのかは評価基準とあわせて要検討ですね。あと、大百科記事のページビューは表示されないようです。
- >これよりRubyに興味を持ってしまった
- 市場の1番目にうp主が今回使った参考書をロックしておきます。この本の前書きにもありますが、はじめてのプログラムされる方の入門書というよりは他言語経験者向けです。
- 1
- 0pt