用例.jpとは、何らかの言葉の用例を検索することができるウェブサイトである。
多数の書籍・ゲーム・ウェブサイト(おそらくWikipediaや青空文庫)などに含まれる文章をデータベースとして保持している。そして様々な言葉を入力すると、データベース内から、その言葉を含む文章を切り出して表示してくれる……というサービス。一種のコーパスであるとも言える。
『Fate/stay night』とか……
の中の文章がヒットする。ただし、「それらの作品の中に確実に含まれるはずの言葉」で検索してもヒットしないことがあるので、作品全文がデータベース化されているとは限らないよう。よって、「特定の言葉が、特定の作品の中に登場していたかどうか」の確定には使用できない。
単純に合致する言葉を探し出してくるだけではなく、用例.jpのトップページ下部にある「このサイトについて」というリンクから飛べる説明ページ「用例.jp について」によれば、
当サイトは、確率的言語モデルを礎石とした自然言語処理技術と五指に余る程の機械学習アルゴリズムで構築された用例・例文検索エンジンを提供します。検索結果のランキングは、当社が独自で開発した「読みやすさ」アルゴリズムによるものです。全ての言語データには、日本語に特化した形態素分析や構文・文脈解析が掛けられており、適切な品詞と関連性の高い文章にマッチするようになっております。
といった処理も行っているとのことである。
用例.jpの各ページ最下部に表示されているコピーライト表示内に「2014-」とあり、またインターネットアーカイブ「Wayback Machine」でも2014年6月30日が最初のアーカイブ
のようであり、2014年から公開されているサイトであるようだ。
「何らかの文章にとある言葉を使いたいが、この用法であっているのか今ひとつ自信が持てない」というときなどに重宝する。小説や記事の執筆、あるいは翻訳など、プロアマ問わず文章を書く人にとってはありがたい存在であるようで、そういった人々の中では類語辞典(シソーラス)サイトなどとともに「役に立つサイト」としてオススメされていることもある。
国立国会図書館が調べものに役立つ情報をまとめて紹介しているウェブサイト「リサーチ・ナビ」でも、2022年7月1日付の記事「言語」において本サイトが紹介されている。
この記事は「人文科学およびジャンル横断的な調べもの(いわゆる総記分野)に役立つデータベースへのリンク集」として作成された「人文リンク集
」という親記事の子記事であり、「国立国会図書館のスタッフも認めた、役立つサイト」ということになる。
利用者の中には著作物の一部を表示するサイトということで著作権などへの侵害とならないのか懸念する声もあるようだ。
用例.jp内の「免責事項」のページによれば「本サービスのコンテンツは教育並びに研究目的のものとして公開されております。」「本サービスのコンテンツ・著作物の引用等は著作権法(引用の場合、著作権法第一章第一節第三十二条)、商標法により保護されております。」とある。
多数の作品の本文をテキストデータ化してデータベース化しているようだが、そのテキストデータ化に関する手法の詳細は公開されていないようで、一切不明である。
電子書籍化された作品であれば、何らかの裏技的な手段でもって自動的にテキストデータ化することもできるかもしれないが、用例が表示される小説作品の中には一切の電子書籍化がなされていないような作品も混じっているようだ。
「紙の本をスキャンしてから文字認識処理を行ってテキストデータ化している」、あるいは「手作業で文章を打ち込んでテキストデータ化している」など、推測は様々にできる。ただ、これらの方法ではかなり手間がかかってしまうと思われる。
各ページ最下部には「Copyright © 2014-2022 Gödel Inc. All rights reserved.」とある。「Gödel」はドイツやオーストリアで用いられる姓(数学者であり論理学者だった「クルト・ゲーデル」が有名)で、「ゲーデル」とカタカナ表記される。「Inc.」は「Incorporated」の略で「法人化された」の意味だが、企業名中の「株式会社」を英訳するときにも用いられる。よって「ゲーデル株式会社」が運営主体なのかもしれない。
法人情報サービスなどで検索すると「ゲーデル株式会社」という会社は東京都に実在するようだ。しかし「ゲーデル」という有名な学者の苗字の名前を流用した名称であれば偶然被る可能性もあり、この法人情報サービスで確認できる「ゲーデル株式会社」が本当に用例.jpの運営主体なのかは不明である。
用例.jpのサイト内には電話番号や住所やメールアドレスなどの連絡先情報が一切記されていないようだ。
2022年8月14日現在時点においては、記号「-」すなわち半角のハイフンが含まれる言葉は検索できないようだ。
検索しようとすると自動転送(リダイレクト)関連のエラー(ブラウザによってエラー表示は様々)が生じて、検索結果を表示できない。
掲示板
1 ななしのよっしん
2022/08/14(日) 15:46:32 ID: fG0xHSM3Ky
今のところ3つあるコラムも謎で良い。アニメのレビューみたいなのとか。
2 ななしのよっしん
2023/01/09(月) 23:39:57 ID: HWn0h98L9H
琥珀さんで検索すると真っ黒さがわかると思う。
https://
多分データセットは海外コミュニティが作ったのを転用してるよ。
電書になっていない作品のデータ化についてもコミュニティからリクエストがあるという大義名分()があれば有志数人が分担して作業するのは別に手間ではないはず。
日本語学習教材が欲しいとかファン翻訳とかでそんな流れを見たことがある。
急上昇ワード改
最終更新:2025/12/05(金) 19:00
最終更新:2025/12/05(金) 19:00
ウォッチリストに追加しました!
すでにウォッチリストに
入っています。
追加に失敗しました。
ほめた!
ほめるを取消しました。
ほめるに失敗しました。
ほめるの取消しに失敗しました。