用例.jp単語

ヨウレイドットジェイピー
2.3千文字の記事
  • 3
  • 0pt
掲示板へ

用例.jpとは、何らかの言葉の用例を検索することができるウェブサイトである。

大変便利だが、多きサイト

概要

多数の書籍・ゲームウェブサイト(おそらくWikipedia青空文庫)などに含まれる文章をデータベースとして保持している。そして様々な言葉を入力すると、データベース内から、その言葉を含む文章を切り出して表示してくれる……というサービス。一種のコーパスであるとも言える。

例えば『ハリー・ポッターシリーズとか……

銀河英雄伝説シリーズとか……

Fate/stay night』とか……

の中の文章がヒットする。ただし、「それらの作品の中に確実に含まれるはずの言葉」で検索してもヒットしないことがあるので、作品全文がデータベース化されているとは限らないよう。よって、「特定の言葉が、特定の作品の中に登場していたかどうか」の確定には使用できない。

単純に合致する言葉を探し出してくるだけではなく、用例.jpのトップページ下部にある「このサイトについて」というリンクから飛べる説明ページ「用例.jp について」によれば、

サイトは、確率的言語モデルを礎石とした自然言語処理技術と五に余る程の機械学習アルゴリズムで構築された用例・例文検索エンジン提供します。検索結果のランキングは、当社が独自で開発した「読みやすさ」アルゴリズムによるものです。全ての言語データには、日本語に特化した形態素分析や構文・文脈解析が掛けられており、適切な品詞と関連性の高い文章にマッチするようになっております。

といった処理も行っているとのことである。

用例.jpの各ページ最下部に表示されているコピーライト表示内に「2014-」とあり、またインターネットアーカイブWayback Machine」でも2014年6月30日が最初のアーカイブexitのようであり、2014年から開されているサイトであるようだ。

「何らかの文章にとある言葉を使いたいが、この用法であっているのか今ひとつ自信が持てない」というときなどに重宝する。小説や記事の執筆、あるいは翻訳など、プロアマ問わず文章を書く人にとってはありがたい存在であるようで、そういった人々の中では類語辞典(シソーラスサイトなどとともに「役に立つサイト」としてオススメされていることもある。

国立国会図書館が調べものに役立つ情報をまとめて紹介しているウェブサイトリサーチ・ナビ」でも、2022年7月1日付の記事「言語」において本サイト紹介されている。

この記事は「人文科学およびジャンル横断的な調べもの(いわゆる総記分野)に役立つデータベースへのリンク」として作成された「人文リンク集exit」という記事の子記事であり、「国立国会図書館スタッフも認めた、役立つサイト」ということになる。

適法性

利用者の中には著作物の一部を表示するサイトということで著作権などへの侵とならないのか懸念するもあるようだ。

用例.jp内の「免責事項」のページによれば「サービスコンテンツ教育並びに研究的のものとして開されております。」「サービスコンテンツ・著作物の引用等は著作権法引用の場合、著作権法第一章第一節第三十二条)、商標法により保護されております。」とある。

謎のテキストデータ化手法

多数の作品の本文をテキストデータ化してデータベース化しているようだが、そのテキストデータ化に関する手法の詳細は開されていないようで、一切不明である。

電子書籍化された作品であれば、何らかの裏技的な手段でもって自動的にテキストデータ化することもできるかもしれないが、用例が表示される小説作品の中には一切の電子書籍化がなされていないような作品も混じっているようだ。

の本をスキャンしてから文字認識処理を行ってテキストデータ化している」、あるいは「手作業で文章を打ち込んでテキストデータ化している」など、推測は様々にできる。ただ、これらの方法ではかなり手間がかかってしまうと思われる。

謎の運営主体

運営体についても、よくわからない

ページ最下部には「Copyright © 2014-2022  Gödel Inc.  All rights reserved.」とある。「Gödel」はドイツオーストリアで用いられる姓(数学者であり論理学者だった「クルト・ゲーデル」が有名)で、「ゲーデル」とカタカナ表記される。「Inc.」は「Incorporated」の略で「法人化された」の意味だが、企業名中の「株式会社」を訳するときにも用いられる。よって「ゲーデル株式会社」が運営体なのかもしれない。

法人情報サービスなどで検索すると「ゲーデル株式会社」という会社は東京都実在するようだ。しかし「ゲーデル」という有名な学者苗字名前を流用した名称であれば偶然被る可性もあり、この法人情報サービスで確認できる「ゲーデル株式会社」が本当に用例.jpの運営体なのかは不明である。

用例.jpのサイト内には電話番号住所メールアドレスなどの連絡先情報が一切記されていないようだ。

エラー

2022年8月14日現在時点においては、記号「-」すなわち半角ハイフンが含まれる言葉は検索できないようだ。

検索しようとすると自動転送リダイレクト)関連のエラーブラウザによってエラー表示は様々)が生じて、検索結果を表示できない。

関連項目

【スポンサーリンク】

  • 3
  • 0pt
記事編集 編集履歴を閲覧

ニコニ広告で宣伝された記事

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

用例.jp

1 ななしのよっしん
2022/08/14(日) 15:46:32 ID: fG0xHSM3Ky
今のところ3つあるコラムもで良い。アニメレビューみたいなのとか。
👍
高評価
1
👎
低評価
1
2 ななしのよっしん
2023/01/09(月) 23:39:57 ID: HWn0h98L9H
琥珀さん検索するとさがわかると思う。
https://yourei.jp/%E7%90%A5%E7%8F%80%E3%81%95%E3%82%93exit
多分データセット海外コミュニティが作ったのを転用してるよ。
電書になっていない作品のデータ化についてもコミュニティからリクエストがあるという大義名分()があれば有志数人が分担して作業するのは別に手間ではないはず。
日本語学習教材が欲しいとかファン翻訳とかでそんな流れを見たことがある。
👍
高評価
2
👎
低評価
0

急上昇ワード改