(有)未来検索ブラジルが運営するあらゆる言葉についての記事を閲覧・編集したり、コメントをしたりするサイトです。

単語記事: ニコニコ大百科:仕様

編集

ニコニコ大百科システム上の仕様をまとめていきます。

間違い、構成改定があった場合の修正では編集コメントに「〜〜修正」「〜〜の構成を改定」、仕様変更があった場合の更新では編集コメントに「〜〜更新」と書いてください。

記事作成

記事名の制限

記事名にはUnicodeの基本言面以外の文字(U+10000 - U+10FFFF)は使用できない[1]。サロゲートペアで追加言面の文字を表して記事名とすることもできないと思われる。

記事名にASCIIの制御コード(U+0000 - U+001F)は使うことはできない。それ以外の基本言面の制御文字は使用できる(が、制御文字なので読めない)。

記事名の末尾に空白文字およびアンダースコアを加えることはできない。表示用記事名の末尾に加えることは可だが、あくまで表示用記事名なので記事名としてはそれらが無いのと同じ扱いとなる。また、記事名に連続した空白文字を含めることはできない(途中で仕様がかわったのか現存する例外あり)。

記事名のURLエンコードの都合により、記事名の末尾に「/.」をつけることはできない。(途中で仕様が変わったため、現存する例外あり)。

記事名の長さは1文字以上64文字以内(正確には文字数ではなく正規化した後のコードポイント数)。

記事名の正規化

単語記事の新規作成時は、当然作成する記事名を入してから編集画面に移るわけだが、この時に記事名が一定のルールに従って自動的に変更される。たとえばラテンアルファベット大文字が小文字に変更され、半カタカナが全カタカナに変換される。

この記事名は、正規化された記事名の文字列と、「互換な」文字列に変更することができる。正規化された記事名と互換な文字列は同じ記事をす文字列とされ、同じ記事への自動リンクの対となる。

正規化された記事名を、UTF-8でURLエンコードしたものが記事のURLとして用いられる。下のHTTPリダイレクトも参照。

変換ルールの詳細

技術的にはUnicode正規化のうちNFKC形式の正規化がなされ、その後ラテンアルファベットの大文字を小文字に変換、アンダースコア(_)の半角スペース( )へ変換、連続する半角スペースを1つにまとめる変換が行われている。

テンアルファベット以外の小文字・大文字については区別され変換されない。たとえばギリシャ文字キリル文字については大文字と小文字は区別される。

正規化される文字列

大文字・小文字、半・全カナ以外の代表例を挙げる。

元の文字 正規化後
1
元の文字 正規化後
tel
元の文字 正規化後
viii
元の文字 正規化後

...
元の文字 正規化後
㋋㏷
12月24日
元の文字 正規化後
¼
1/4
元の文字 正規化後

アルファ
元の文字 正規化後

صلى الله عليه وسلم
ریال
元の文字 正規化後
h

最初に記事名を入するときは注意して入するものだが、一旦編集を始めてしまうと記事本文の方に注意が向いてしまって、記事名が変換されたことに気づかず投稿してしまう人が散見される。

既存記事と同じ名前の新規記事を作成しようとした場合

作成しようとしている記事(A)の記事名が既に別の記事(B)に使われている場合、記事(A)の新規作成ページではなく記事(B)の編集ページに移動する。ただし、記事のカテゴリがそれぞれ異なる場合(既存の単語記事と同名の生放送記事を作ろうとした場合など)、この現は発生しない。記事名の重複が起こらないようにするための仕様

この仕様を応用し、作ろうとしている記事が既に別の誰かに作成されていないかを確認することも可

記事名によるGoogleAdSense表示抑制

記事名内に特定のワードが含まれている場合、その記事ページ内のGoogleAdSense表示が抑制される。
ニコニコ大百科:運営マーキングワード一覧

記事サイズの上限

記事の文章のサイズの上限はHTMLテキスト1MBサイトが重くならないための対策だとは考えられない。

サムネイル表示の貼り付け数上限

記事内に貼りつけられる動画・静画生放送プロフィール市場等はインラインフレームを使用したサムネイル表示だが、1つの記事に貼り付けることのできるのは最大64個までで、 65個をえるとエラーとなり投稿できない。
これは、サイトが重くならないための対策だと考えられる。

また、同一のサムネイル表示は最大3個までで、同じものを4個以上貼り付けるとエラーとなり投稿できない。

自動リンクとHTTPリダイレクトの仕様

自動リンク

記事中および掲示板でのレスの中で、記事が存在する言葉を入すると(抑制する措置をとらない限り)記事へのリンクが自動で作成される。本稿ではこれを自動リンクと呼ぶ。当然のことだが、前方から一致候補を検索していく。例として「グロリア」の、'10年5月20日現在の状況から説明する。

  1. グロリア」・・・未作成なのでパス
  2. グロリ」・・・同上
  3. グロ」・・・作成済みかつ自動リンク有効なのでリンクる。次は「リア」とかで検索。

ゆえに、今回の例では「ロリ」にはリンクられない訳である。

上記の、前方から一致候補を検索していくという点について、同じく'10年5月20日の挙動から例を挙げる。ここで例として用いるのは、「箱春香」と「春香ファンの聖地」である。

  1. 箱春香」・・・「箱春香」が表示される。
  2. 箱春香ファン聖地」・・・上記のように、前方の「箱春香」が優先される。

次に、上記の「春香ファンの聖地」と、「春香」を用いて、同じ文字列を含む単同士の優先順位について例を挙げる。

  1. 春香」・・・「春香」が表示される。
  2. 春香ファンの聖地」・・・こちらでは、「春香」は無視された。

このように、同じ文字列を頭に持つ単が複数存在する場合、長い方から優先してリンクが貼られるようである。このことは、例えば「ニコニコ大百科:編集者一覧」と記述した場合、「ニコニコ大百科」にリンクが貼られないことからも分かる。

以上のことをまとめると、以下のようになる。

  1. 前方にある単が優先され、
  2. 同じ言葉が頭にある場合、長い単が優先される。

HTTPリダイレクト

特定の文字を含む記事名のURLアクセスするとHTTPリダイレクトが発生する。

英数字

英数字は半文字に変換した記事名になる。 また、大文字・小文字の区別はない。

数字記号

以下の数字記号は半文字に変換した記事名になる。

また、これらの文字が記事中に現れた場合、変換した文字がある物として自動リンクの判定が行われる。

丸括弧

括弧の全、半は自動で解釈される。

キャベツ(夜明け前より瑠璃色な) 両方半
キャベツ(夜明け前より瑠璃色な) 両方全
キャベツ(夜明け前より瑠璃色な) 右だけ全
キャベツ(夜明け前より瑠璃色な) 左だけ全

感嘆符・疑問符

の!と?は、半の!と?に自動で解釈される。

  1. U.N.オーエンは彼女なのか?U.N.オーエンは彼女なのか?
  2. トップをねらえ!トップをねらえ!は、同じ記事にリンクされる。

また、新規に記事を立ち上げる際、記事名に全の!や?を用いても、自動で半に修正されるようである。

待ち時間

ニコニコ大百科上での操作(編集)には短時間での連続操作を抑制するための待ち時間が設けられている。これはニコニコ大百科サーバにかかる負荷の低減と、荒らしによる記事破壊活動の抑制を的としている。

待ち時間は同系列の操作を連続して行う時に発生する。系列が違う操作の連続に対しては待ち時間は無い。

記事作成
記事作成し投稿してから次に記事作成して投稿するまでには15分間の待ち時間が設定されている。
記事編集
記事編集し投稿してから次に記事編集して投稿するまでには1分間の待ち時間が設定されている。
記事名変更
記事名変更を確定してから次の記事名変更確定までには2分間の待ち時間が設定されている。
掲示板書き込み
掲示板へ書き込んでから次の掲示板書き込みまでには1分間の待ち時間が設定されている。

アイコンからのリンク

ニコニコ大百科の記事はニコニコ動画の各サービスで使われているタグなどの脇に表示されるニコニコ大百科アイコンから同名の記事へとリンクする仕組みとなっている。記事の有無はアイコンの表示状態で確認出来る。

動画

動画上部に並んで表示されるタグ

動画記事

人気のタグ

あなたにオススメの動画

静画(ニコニコ静画)

生放送(ニコニコ生放送)

放送者

生放送画面の上に並んで表示されるタグ

ニコニコニュース

ニコニコ市場(商品詳細ページ)

ニコニコチケットセンター

配信映画タイトル

ニコニコチャンネル映画カテゴリから配信される映画タイトルからもリンクされている。

記事検索

ページ左上の検索フォームから入した検索ワードにより、記事名や記事内容で検索が可

  • ・半や大文字・小文字等の表記上の違いがあっても双方が検索にヒットする。
  • 記事名検索では記事のヨミガナも常に検索対である。
  • 検索ワード空白けて複数ワードで検索した場合はいわゆるAND検索となる。
  • OR検索、-による除外検索正規表現による検索には対応していない。

基本的に検索ワードと同じ文字列が見つかると検索にヒットするが、数字の場合は制限があり、検索対となる記事名や記事内容中に現れる数字は、そこでの数としてのまとまりが検索可な最小単位となる。

つまり「1000」という数字を検索する場合は検索ワードとしては「1000」そのものを使わねばならない。「1000」という文字を構成している「1」「0」「10」[00]等が検索ワードだった場合は「1000」を見つけることは出来ない。

アルファベット・数字・半角記号文字に隣接したその他の文字による検索

上記の項名が非常にわかりにくいが、つまり「2ちゃんねる」は「2ち」という検索ワードで検索可か、という話。この例の「2ち」での検索では「2ちゃんねる」はヒットしない。しかし「2ちゃ」で検索した場合はヒットする。

「2ちゃんねる」での記事タイトルからの記事検索結果
「2ち」での記事タイトルからの記事検索結果
「2ちゃ」での記事タイトルからの記事検索結果

このように、アルファベット・数字・半記号文字に隣接している文字を1文字加えた検索ワードの場合はうまく働かない。隣接文字を2文字以上定すれば検索可である。

上記は検索ワードの前方側にアルファベット・数字・半記号文字がある場合で、後方側にある場合はまた結果が変わり、検索ワード内の隣接文字が1文字であっても検索可である。

「ル5」での記事タイトルからの記事検索結果

このように、検索ワード「ル5」による検索では「スペースチャンネル5」や「レベル5デス」の記事がヒットする。

数字を含む記事名検索のコツ

上記したように、数字を対とした検索は中途半端な検索ワードでは見つけられない場合がある。

対策としては数字部分は省略することなくすべてを検索ワードに入することであるが、記事名検索の場合は必ずカタカナのヨミガナが設定されているので、数字部分のヨミガナ側を検索ワードとして入するのも1つの方法である。

関連リンク

脚注

  1. *要望として提出済み。ニコニコ大百科:ToDo U+20AD3コードを持つ記事名(𠫓)で単語記事を作れるようにする。
携帯版URL:
http://dic.nicomoba.jp/k/a/%E3%83%8B%E3%82%B3%E3%83%8B%E3%82%B3%E5%A4%A7%E7%99%BE%E7%A7%91%3A%E4%BB%95%E6%A7%98
ページ番号: 178842 リビジョン番号: 1514556
読み:ニコニコダイヒャッカシヨウ
初版作成日: 08/05/30 22:52 ◆ 最終更新日: 12/04/30 01:11
編集内容についての説明/コメント: 英字検索の仕様変更に合わせて記事検索の解説を変更
記事編集 / 編集履歴を閲覧 /

ニコニコ大百科:仕様について語るスレ

39 : ななしのよっしん :2011/02/19(土) 18:37:06 ID: vhVzb0r3yn
>>38
仕様だと思う
あっちの運営はいろいろ適当だし
40 : ななしのよっしん :2011/05/15(日) 20:44:29 ID: nIPhQt/L1E
動画ページに表示されなくなったね。なんでだろ?
41 : ななしのよっしん :2011/05/15(日) 20:52:29 ID: AQWfx6v81J
>>40
動画側の不具合で表示されなくなったんだけど、そっちが復活後に大百科サーバの不具合で表示出来なく
なってたので、動画・生放送ニコニコニュース市場側でアイコン表示を一時停止しているのでは
ないかとおもう。実際どうなのかは不明。
ニコニコインフォで流れる情報も古いし、詳細書かれてないからねえ。
42 : ななしのよっしん :2011/09/26(月) 16:15:56 ID: +upYhXtO9e
いつの間にか掲示板投稿後の待ち時間が10秒になってた
43 : ななしのよっしん :2012/04/14(土) 11:33:28 ID: Iy5x+f5uuj
長谷川明子について語るスレに「

この掲示板には規制がかかっていて、投稿できない状態です。

」て書かれてるんだが
44 : ななしのよっしん :2012/04/14(土) 14:15:09 ID: AQWfx6v81J
>>43
そういう話はこっちで。→編集規制記事一覧
45 : 43 :2012/04/14(土) 22:08:44 ID: Iy5x+f5uuj
>>44
誘導ありがとう

スレチな気はしてたんだが、書き込むべきがわからんかった
46 : ななしのよっしん :2012/04/23(月) 16:00:44 ID: oAvAzAagEu
大百科の検索の仕様が変更されてますね
具体的には"inecr"で"minecraft"が拾えるようになっていたり"2ち"で"2ちゃんねる"が拾えたり
47 : ななしのよっしん :2012/04/23(月) 16:14:23 ID: AQWfx6v81J
>>46
仕様変更されたのは知ってはいるんですが、詳しく検してないのでまだ記事は
更新できてないです。なんか英文字だけ完全一致検索可になって、数字は無理
相変わらずなんですよね。どうせならどちらも出来るようになって欲しいのですが。

ちなみに「2ち」で「2ちゃんねる」を見つけるのは今もできません。
48 : ななしのよっしん :2012/04/26(木) 18:25:22 ID: oAvAzAagEu
>>47
自分でやったらできたのにどういうことだ?と思ったけど単生放送記事検索だと出来ないのですね‥
単語記事検索をしていたことに気づきませんでした。申し訳ない
というかそれぞれの出を単純に合わせたものが単生放送記事検索だと思い込んでいました
そのあたりをまとめた記述ってもしかしてどこかにありますか?
ページトップへ戻る