Database
Database List
-
震災お見舞い
Last Update: 2011-04-01T09:58:44+09:00 History
-
検索支援スクリプト
Last Update: 2009-01-22T15:48:32+09:00 History
-
感情語が文章にいくつ含まれているかをカウントするために
感情語を登録しておくデータベースですLast Update: 2017-09-06T16:15:44+09:00 History
-
multilookupのテスト用
Last Update: 2019-12-31T00:01:49+09:00 History
-
Last Update: 2010-04-24T15:22:57+09:00 History
-
"url": "^http://61\\.211\\.226\\.201/cgi-bin/gazou-bbs/look-imgboard\\.cgi",
"nextLink": '//a[starts-with(@href,"./look-imgboard.cgi?page=") and preceding-sibling::b]',
"pageElement": '//center/*[position() > 1]',Last Update: 2009-01-22T15:48:32+09:00 History
-
Last Update: 2010-05-01T13:51:18+09:00 History
-
http\:\/\/kanasoku\.info
Last Update: 2013-10-14T18:14:35+09:00 History
-
アリババ
Last Update: 2009-07-21T23:38:35+09:00 History
-
Last Update: 2011-07-12T12:09:31+09:00 History
-
ことせかい という読み上げアプリで利用するデータです。
Webで読める小説を取り込むために、文書の場所や次のページへのlinkなどをさすxpathを記述します。
幾つかの項目はAutopagerizeとほぼ同じ意味です。
ことせかい については以下のURLを参照してください。
http://limura.github.io/NovelSpeaker/
以下、個々の属性についての概ねの方針を書いておきます。
url
対象のURLしてヒットする正規表現を書きます。
pageElement
読み上げ対象となる文字列が含まれるエレメントを取り出すxpathを書きます。複数hitするようなxpathを書いた場合、その全てが取り出されます。
nextLink
次のページに続く場合のaタグを指定するxpathを書きます。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
Autopagerize側では必須属性になっていますが、こちらでは必須ではありません。つまり、Autopagerizeは(その目的から)1ページに全てが入っているサイトは登録されていませんので、そのようなサイトはこちらに登録する必要があります。また、Autopagerize側で主題が違う記事へのnextLinkが指定されているものについて、こちら側のデータベースにnextLinkが無い状態で登録することによって、主題が違う記事を読み込まないようにする事もできなくもありません。
title
本棚に登録される時の名前として採用される文字列を含むエレメントを取り出すためのxpathを書きます。
subtitle
(2017/12/18: 将来的に利用するための項目です)小説の個々の章にあたるサブタイトルを抽出できるエレメントを取り出すためのxpathを書きます。
author
作者名として採用される文字列を含むエレメントを指定するxpathを書きます。
firstPageLink
小説のタイトルページ(本文は含まない)がある場合、そのタイトルページから本文のページに遷移するためのaタグを指定します。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
注意:firstPageLink にヒットした場合、そのURLを読み直して評価をし直すため、無限に firstPageLink の読み込み先を読んで場合があります。そのようにならないように firstPageLink の xpath を指定してください。
tag
その小説等に関する文字列タグが列挙されているエレメントがある場合は指定します。将来的に小説の検索などに使われるタグとして利用されるつもりのものになります。幾つかターゲットを書いてみたところ、どうやら Aレコード でタグへのlinkになっているものが多いようで、その場合は内部にスペースがあるタグなども見受けられましたため、Aレコードのようなエレメント毎に一つのタグとして取り込めないかな?と思っています。ということでできればAレコードそのものを取り出すように(a/text() のような XPath を書いてテキストだけにしないように)して頂ければ幸いです。
isNeedHeadless
JavaScriptが動作した後に本文部分(pageElement)が生成される場合には何らかの値("true"が推奨)を入れます。"false" や "False", "nil", "0", ""(何も入れない) の場合には単にGETリクエストで取得された値について評価して良いという意味になります。
nextButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を次へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、nextLink よりも nextButton の方が先に評価されます(nextButton と nextLink が両方共に存在する場合は nextButton が優先されます)。
firstPageButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を最初の本文へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、firstPageLink よりも firstPageButton の方が先に評価されます(firstPageButton と firstPageLink が両方共に存在する場合は firstPageButton が優先されます)。
forceClickButton
(実験的機能なので将来的に変更される可能性があります)isNeedHeadless が有効になっている場合、ここで指定される要素が存在した場合はその要素に対して .click() が実行された後、改めて内容を評価し直します。特定のボタンを押さないと先に進めない場合などに利用します。
waitSecondInHeadless
isNeedHeadless が有効になっている場合、ページが読み込まれたと思われる後、さらにここで指定される数値で指定される秒数待った後にinnerHTMLを評価します。
injectStyle
pageElement で取り出した後のHTMLに対して強制的に適用するstyleを記述します。これは、pageElementで取り出した後のHTMLにはstyleが適用されない(パスが違うのでstyleが適用されないであるとか、pageElementで取り出されたHTMLにはstyleが無いであるとか、styleは別のファイルになっているのでGETリクエスト一回では取り出せないであるといったときに、white-space:pre-wrap; で指定されるようなコンテンツが入っているとHTMLからStringに変換した時に改行周りとかが省略されてしまって悲しいことになるという問題を回避するための物になります。(例えば、pageElement として <div class="content xxx yyy">...</div> が取り出されるのがわかっている場合、"div.content{white-space:pre-wrap;}" といったような値を指定する事を期待しています。
exampleUrl
対象のURLを書きます。後で動作確認などをする時に利用します。複数書く場合は半角スペースで区切ってください。
memo
何らかのメモ書きを残すべきと思った場合は書いておいてください。日本語でOKです。
また、次のページや最初のページを判定するための要素がいくつかあるのでそれらの優先順位を別途書き記しておきます。
優先される順序は
1. forceClickButton
2. nextButton
3. firstPageButton
4. nextLink
5. firstPageLink
の順(数字が若い方が優先)になります。
なお、ことせかい の動作としては、このデータベースとAutopagerizeのデータベースの両方を使ってデータを読み込むように作られています。
動作としては対象のURLについて、まずこちらのデータベースにあるものが優先され、こちらのデータベースに載っていないURLのものについてはAutopagerizeのデータベースを参照することになります。
ですので、Autopagerize側で定義されている情報で十分なものの場合は改めてこちら側のデータベースに登録する必要は無いかもしれません。Last Update: 2024-04-16T12:03:19+09:00 History
-
Last Update: 2011-09-06T08:30:32+09:00 History
-
zongbao
Last Update: 2010-07-13T15:06:16+09:00 History
-
Last Update: 2020-05-25T09:32:58+09:00 History
-
Last Update: 2009-01-22T15:48:32+09:00 History
-
comic
Last Update: 2011-07-15T21:54:30+09:00 History
-
Test.
Last Update: 2022-07-14T01:50:39+09:00 History
-
woremacx
Last Update: 2010-06-19T19:09:12+09:00 History
-
レポート用
Last Update: 2010-05-01T13:57:40+09:00 History
-
Last Update: 2017-05-26T05:53:03+09:00 History
-
for developers, you can try to test by this database.
thus...
* you can't delete this.
* you can't modify structure.
Last Update: 2012-08-10T23:50:42+09:00 History
-
just a wave.
Last Update: 2011-08-05T05:03:09+09:00 History
-
copy.js(vimperator plugin)のexample
Last Update: 2010-05-01T13:58:42+09:00 History
-
videoget script
Last Update: 2009-10-29T12:19:03+09:00 History
-
Limechatスクリプト、UstreamStatusWatcher用のUstreamチャンネル対応を保持します。
Last Update: 2013-08-04T18:42:53+09:00 History
-
Last Update: 2013-10-22T16:41:08+09:00 History
-
Last Update: 2013-10-16T13:55:54+09:00 History
-
UStoreProject9
Last Update: 2013-10-22T16:41:11+09:00 History
-
UStoreProject8
Last Update: 2013-10-16T15:14:11+09:00 History
-
Last Update: 2013-10-22T15:02:55+09:00 History
-
Last Update: 2013-10-16T13:58:43+09:00 History
-
Last Update: 2013-10-22T16:01:26+09:00 History
-
Last Update: 2013-10-16T15:14:10+09:00 History
-
Webサービスのユーザ画像の情報を共有します。
Webサービスのユーザのアイコン画像を抽出するサービス http://usericons.relucks.org/ で利用しています。
service_name: Webサービスの名前
url: 適用できるurlの正規表現。ユーザ名の部分は()でくくる
iconPageUrl: ユーザアイコンが表示されるページのURL。ユーザ名の部分は{user_id}にする。
iconImageElement: iconPageUrlでユーザアイコンの画像要素を指定するXPath式
exampleUrl: iconPageUrlの一例
exampleImageUrl: exampleUrlのユーザアイコン画像のURL
Last Update: 2010-11-04T21:37:46+09:00 History
-
もとは、androidのN2TTSやVocalizerという読み上げアプリ用に作ったユーザー辞書(読み替え単語集)です。
最近のTTSエンジンは十分に賢いので、このユーザー辞書を使うと、かえって読み上げ精度や抑揚が悪くなるかも。
(例:「青瓦台」は、googleテキスト読み上げでは「セイガダイ」と正しく読めるが、マイクロソフトのHarukaでは「アオガワラダイ」と読んでしまうなど、TTSエンジンによって得意・不得意がある)
ベクターのフリー辞書などを転用して、時代小説などに頻出する地名や人名などを登録してみました。
TabSpeechというChromeプラグインでユーザー辞書(読み替え)のデータベースを指定できるので、このデータベースも利用できると思います。
★ユーザー辞書を充実させるため、単語追加歓迎します。
ただ、隆盛(人名でのタカモリ、普通名詞のリュウセイ)とか意味によって読み方が変わる言葉は、下手に登録せず、読み上げエンジンのアルゴリズムに任せたほうがよい気がします。
表(ひょう、おもて)とか明(あきら、国名のミン)など、一文字の漢字も登録しないでください。一括して登録した読みに置き換わる結果、「説明」を「せつミン」と読んだり、かえっておかしくなるので。
Last Update: 2019-12-01T07:54:08+09:00 History
-
Twitterで画像のサムネイルを表示するスクリプト用のデータベースです。
http://d.hatena.ne.jp/furyu-tei/20101208/1291741670
用です。
これは、
https://gist.github.com/156953/916877a4eb57c77b57ebe654028622db8eb80493
http://sharedfile.jp/r/3kyDGF2lDpNMIcQN/
http://d.hatena.ne.jp/furyu-tei/20101205/1291558827
で、スクリプト内に書かれていた定義を外出ししたものです。
Last Update: 2010-12-14T23:21:56+09:00 History
-
URL のパラメーターを管理するデータベースです。
不要なパラメーターを削除し、リダイレクトする User Script
http://userscripts.org/scripts/show/70851
不要なパラメーターを削除し、 history.replaceState で URL を書き換える User Script (リダイレクトなし)
http://userscripts.org/scripts/show/100611
url
正規表現で対象 URL を指定します。
live
URL に残しておきたいパラメーター名を指定します。マッチした場合は指定したパラメーター以外は削除します。
kill
URL から消し去りたいパラメーター名を指定します。マッチしなかったパラメーターは残ります。
live と kill を指定していた場合 live のほうが優先されます。
Last Update: 2019-01-28T22:53:00+09:00 History
-
TwitterUtilで用いる、TwitterのWebページのスクレイピング用データです。
Last Update: 2010-05-01T13:56:10+09:00 History
-
twitterのfromに表示されるあれ
http://userscripts.org/scripts/show/44339
Last Update: 2010-05-01T13:57:43+09:00 History
-
twitterで他人のtweetに反応するbotリスト
他人のtweetに反応するbotを作る時は無視するようにしましょう!!!!
manager: botの管理者のtwitter id
keyword: 反応するキーワード(改行区切り)
Last Update: 2010-05-19T16:22:25+09:00 History
-
twitterの著名人リスト(bot除く)
Last Update: 2010-05-01T13:57:46+09:00 History
-
twitterにいるbotリスト
Last Update: 2010-05-01T13:57:57+09:00 History
-
TweenのHTML解析用キーデータ
Last Update: 2010-05-01T13:56:44+09:00 History
-
metadata of tumblr gear will be stored here.
Last Update: 2010-05-01T13:57:41+09:00 History
-
New Words List
Last Update: 2010-11-14T21:25:56+09:00 History
-
Appleの読み上げエンジン(Siri等の奴)での読み上げを修正するテーブルです。こちらは from 部が正規表現であると仮定したデータベースとなります。
正規表現を使わない読み替えの場合は
http://wedata.net/databases/TTS%20Convert%20Table%20for%20Apple%20TTS%20Engine%20(jp)/items
に追加してもらえると嬉しいです。
to部 には $1 $2 等を書けるとは思いますが、正規表現を解釈するものによっては利用できない正規表現があるかと思うので、できるだけどんな正規表現エンジン(?)でも動くような正規表現を使うと良い気がします。
このデータベースは今の所、TabSpeech という Chrome Extension
https://chrome.google.com/webstore/detail/tabspeech/ccojlmmbakjcoddbepmmogiobbmmhmjc?hl=ja
から利用されています。Last Update: 2020-02-16T12:04:11+09:00 History
-
Appleの読み上げエンジン(Siri等の奴)での読み上げを修正するテーブルです。
正規表現を使って書き換えたい場合には
http://wedata.net/databases/TTS%20Regulaer%20Expression%20Convert%20Table%20for%20Apple%20TTS%20Engine%20(jp)
に追加してもらえると嬉しいです。
このデータベースは今の所、TabSpeech という Chrome Extension
https://chrome.google.com/webstore/detail/tabspeech/ccojlmmbakjcoddbepmmogiobbmmhmjc?hl=ja
から利用されています。Last Update: 2023-12-30T21:29:02+09:00 History
-
TTBase( http://ttbase.sourceforge.jp/ )用のプラグイン情報です。
(まだ存在しませんが、)プラグインのインストール用プログラムで使用します。
アイテムの名前: プラグインを識別するID
name: プラグイン名称
url: プラグインの紹介ページURL
author: プラグイン作者
author_url: プラグイン作者のURL(省略可能)
summary: プラグインの説明(4~50文字程度)
description: プラグインの詳細説明(省略可能)
tag: プラグインのタグ(スペース区切りで複数指定可能。省略可能)
version: プラグインのバージョン(この文字の大小でバージョン比較を行います)
file_url: プラグインのダウンロードURL
update_date: プラグイン更新日
アイテムの名前が同じ場合、同一のプラグインとみなします。
同一のプラグインの場合はversionの大小を比較し、最新のプラグインを探します。
Last Update: 2010-12-18T21:03:09+09:00 History
-
Last Update: 2017-09-24T11:29:08+09:00 History
-
this rules would like to pile up urls by replacing
Last Update: 2010-11-06T21:33:38+09:00 History