wedata

14%7c1:%7c%7c4%7c9&chf=bg,s,f3f4ee&chxt=x,y&chs=250x150&cht=lc

AutoPagerize_cushion by kenzou_ogawa2

このデータベースはAutoPagerizeを更新するまでもない思いついたコードを書くためのものです。
喧々諤々の議論をするとかユーザーに新たな選択肢を提供するとかよりも行き場のないコードを供養する場と考えてください。

Last Update: 2023-11-04T14:37:16+09:00 History

2023-09-12T04:24:46+09:00

kenzou_ogawa2

details

27%7c1:%7c%7c10%7c20&chf=bg,s,f3f4ee&chd=s:adddddddddddddddddddddddddddddddsssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssvvvvvvvvvvvvvvvvvvvvvvvyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyybbbbbeeeeeeehhhhhhkkkkkkkkkkkkkknnqqqqqtttttttwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwzzzzzz222222222222222222222222222222222222225555555555555555555555555599&chxt=x,y&chs=250x150&cht=lc&chco=9acd32

InfyScroll by infy

Last Update: 2024-02-26T10:59:45+09:00 History

2022-08-01T12:19:50+09:00

infy

details

14%7c1:%7c%7c2&chf=bg,s,f3f4ee&chxt=x,y&chs=250x150&cht=lc

X by infy

Test.

Last Update: 2022-07-14T01:50:39+09:00 History

2022-06-02T07:53:58+09:00

infy

details

09%7c1:%7c%7c1&chf=bg,s,f3f4ee&chxt=x,y&chs=250x150&cht=lc

online-shows by loveveryday

Settings and history of online shows.

Last Update: 2021-06-08T23:10:01+09:00 History

2021-05-01T15:33:24+09:00

loveveryday

details

AutoCAPTCHA by Takuya Ono 4

CAPTCHA_INFO

* URL String 対象となるサイトのURLにマッチする正規表現
* image String CAPTCHA画像のセレクタ
* input String 結果を入力するフィールドのセレクタ
* button (optional) String 実行ボタンのセレクタ
* calculate (optional) boolean 認識したものを評価できるようにする正規表現
* exampleUrl (optional) String URLの具体例

Last Update: 2020-09-26T13:48:30+09:00 History

2020-09-26T00:27:50+09:00

Takuya Ono 4

details

25%7c1:%7c%7c1&chf=bg,s,f3f4ee&chxt=x,y&chs=250x150&cht=lc

yomikae_test by Naagle

Last Update: 2020-05-25T09:32:58+09:00 History

2020-05-25T09:32:58+09:00

Naagle

details

16%7c1:%7c%7c1&chf=bg,s,f3f4ee&chxt=x,y&chs=250x150&cht=lc

Speech_conversion_list by qwuuee

test

Last Update: 2020-03-16T10:15:24+09:00 History

2020-03-16T10:15:15+09:00

qwuuee

details

iwaratags by eroamane

Last Update: 2020-01-06T23:02:20+09:00 History

2020-01-06T21:34:58+09:00

eroamane

details

実験 by kazehotaru

multilookupのテスト用

Last Update: 2019-12-31T00:01:49+09:00 History

2019-12-30T22:53:37+09:00

kazehotaru

details

Rateshare by Aga Khan XVIII

Last Update: 2019-12-17T18:37:57+09:00 History

2019-12-17T18:37:57+09:00

Aga Khan XVIII

details

User Dictionary for TTS (Text to Speech) by ikenami_s

もとは、androidのN2TTSやVocalizerという読み上げアプリ用に作ったユーザー辞書(読み替え単語集)です。
最近のTTSエンジンは十分に賢いので、このユーザー辞書を使うと、かえって読み上げ精度や抑揚が悪くなるかも。

（例：「青瓦台」は、googleテキスト読み上げでは「セイガダイ」と正しく読めるが、マイクロソフトのHarukaでは「アオガワラダイ」と読んでしまうなど、TTSエンジンによって得意・不得意がある）

ベクターのフリー辞書などを転用して、時代小説などに頻出する地名や人名などを登録してみました。

TabSpeechというChromeプラグインでユーザー辞書（読み替え）のデータベースを指定できるので、このデータベースも利用できると思います。

★ユーザー辞書を充実させるため、単語追加歓迎します。
ただ、隆盛（人名でのタカモリ、普通名詞のリュウセイ）とか意味によって読み方が変わる言葉は、下手に登録せず、読み上げエンジンのアルゴリズムに任せたほうがよい気がします。
表（ひょう、おもて）とか明（あきら、国名のミン）など、一文字の漢字も登録しないでください。一括して登録した読みに置き換わる結果、「説明」を「せつミン」と読んだり、かえっておかしくなるので。

Last Update: 2019-12-01T07:54:08+09:00 History

2019-11-22T20:00:35+09:00

ikenami_s

details

08%7c1:%7c%7c2&chf=bg,s,f3f4ee&chs=250x150&cht=lc&chxt=x,y

TTS Regulaer Expression Convert Table for Apple TTS Engine (jp) by limura

Appleの読み上げエンジン(Siri等の奴)での読み上げを修正するテーブルです。こちらは from 部が正規表現であると仮定したデータベースとなります。
正規表現を使わない読み替えの場合は
http://wedata.net/databases/TTS%20Convert%20Table%20for%20Apple%20TTS%20Engine%20(jp)/items
に追加してもらえると嬉しいです。

to部には $1 $2 等を書けるとは思いますが、正規表現を解釈するものによっては利用できない正規表現があるかと思うので、できるだけどんな正規表現エンジン(?)でも動くような正規表現を使うと良い気がします。

このデータベースは今の所、TabSpeech という Chrome Extension
https://chrome.google.com/webstore/detail/tabspeech/ccojlmmbakjcoddbepmmogiobbmmhmjc?hl=ja
から利用されています。

Last Update: 2020-02-16T12:04:11+09:00 History

2019-09-07T23:24:27+09:00

limura

details

07%7c1:%7c%7c2%7c5&chf=bg,s,f3f4ee&chxt=x,y&chs=250x150&cht=lc

TTS Convert Table for Apple TTS Engine (jp) by limura

Appleの読み上げエンジン(Siri等の奴)での読み上げを修正するテーブルです。
正規表現を使って書き換えたい場合には
http://wedata.net/databases/TTS%20Regulaer%20Expression%20Convert%20Table%20for%20Apple%20TTS%20Engine%20(jp)
に追加してもらえると嬉しいです。

このデータベースは今の所、TabSpeech という Chrome Extension
https://chrome.google.com/webstore/detail/tabspeech/ccojlmmbakjcoddbepmmogiobbmmhmjc?hl=ja
から利用されています。

Last Update: 2023-12-30T21:29:02+09:00 History

2019-09-07T23:15:31+09:00

limura

details

05%7c1:%7c%7c1&chf=bg,s,f3f4ee&chd=s:a&chxt=x,y&chs=250x150&cht=lc&chco=9acd32

Snieone by Snie

Last Update: 2019-09-05T15:00:38+09:00 History

2019-09-05T15:00:38+09:00

Snie

details

28%7c1:%7c%7c4&chf=bg,s,f3f4ee&chd=s:attt9&chxt=x,y&chs=250x150&cht=lc&chco=9acd32

node_block by jigendaddy_be

Last Update: 2018-07-28T16:39:42+09:00 History

2018-07-25T12:49:33+09:00

jigendaddy_be

details

30%7c1:%7c%7c1&chf=bg,s,f3f4ee&chxt=x,y&chs=250x150&cht=lc

heruji by heruji

Last Update: 2018-03-30T15:19:23+09:00 History

2018-03-30T15:19:23+09:00

heruji

details

07%7c1:%7c%7c1&chf=bg,s,f3f4ee&chxt=x,y&chs=250x150&cht=lc

jpmagnet by Gene

Last Update: 2018-02-07T15:34:09+09:00 History

2018-02-07T15:13:26+09:00

Gene

details

07%7c1:%7c%7c1&chf=bg,s,f3f4ee&chd=s:a&chxt=x,y&chs=250x150&cht=lc&chco=9acd32

arthur125 by arthur125

I'm from Taiwan

Last Update: 2017-12-07T15:49:44+09:00 History

2017-12-07T15:49:44+09:00

arthur125

details

16%7c1:%7c%7c175%7c350&chf=bg,s,f3f4ee&chxt=x,y&chs=250x150&cht=lc

ことせかいWebページ読み込み用情報 by limura

ことせかいという読み上げアプリで利用するデータです。
Webで読める小説を取り込むために、文書の場所や次のページへのlinkなどをさすxpathを記述します。
幾つかの項目はAutopagerizeとほぼ同じ意味です。

ことせかいについては以下のURLを参照してください。
http://limura.github.io/NovelSpeaker/

以下、個々の属性についての概ねの方針を書いておきます。

url
対象のURLしてヒットする正規表現を書きます。

pageElement
読み上げ対象となる文字列が含まれるエレメントを取り出すxpathを書きます。複数hitするようなxpathを書いた場合、その全てが取り出されます。

nextLink
次のページに続く場合のaタグを指定するxpathを書きます。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
Autopagerize側では必須属性になっていますが、こちらでは必須ではありません。つまり、Autopagerizeは(その目的から)1ページに全てが入っているサイトは登録されていませんので、そのようなサイトはこちらに登録する必要があります。また、Autopagerize側で主題が違う記事へのnextLinkが指定されているものについて、こちら側のデータベースにnextLinkが無い状態で登録することによって、主題が違う記事を読み込まないようにする事もできなくもありません。

title
本棚に登録される時の名前として採用される文字列を含むエレメントを取り出すためのxpathを書きます。

subtitle
(2017/12/18: 将来的に利用するための項目です)小説の個々の章にあたるサブタイトルを抽出できるエレメントを取り出すためのxpathを書きます。

author
作者名として採用される文字列を含むエレメントを指定するxpathを書きます。

firstPageLink
小説のタイトルページ(本文は含まない)がある場合、そのタイトルページから本文のページに遷移するためのaタグを指定します。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
注意：firstPageLink にヒットした場合、そのURLを読み直して評価をし直すため、無限に firstPageLink の読み込み先を読んで場合があります。そのようにならないように firstPageLink の xpath を指定してください。

tag
その小説等に関する文字列タグが列挙されているエレメントがある場合は指定します。将来的に小説の検索などに使われるタグとして利用されるつもりのものになります。幾つかターゲットを書いてみたところ、どうやら Aレコードでタグへのlinkになっているものが多いようで、その場合は内部にスペースがあるタグなども見受けられましたため、Aレコードのようなエレメント毎に一つのタグとして取り込めないかな？と思っています。ということでできればAレコードそのものを取り出すように(a/text() のような XPath を書いてテキストだけにしないように)して頂ければ幸いです。

isNeedHeadless
JavaScriptが動作した後に本文部分(pageElement)が生成される場合には何らかの値("true"が推奨)を入れます。"false" や "False", "nil", "0", ""(何も入れない) の場合には単にGETリクエストで取得された値について評価して良いという意味になります。

nextButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を次へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、nextLink よりも nextButton の方が先に評価されます(nextButton と nextLink が両方共に存在する場合は nextButton が優先されます)。

firstPageButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を最初の本文へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、firstPageLink よりも firstPageButton の方が先に評価されます(firstPageButton と firstPageLink が両方共に存在する場合は firstPageButton が優先されます)。

forceClickButton
(実験的機能なので将来的に変更される可能性があります)isNeedHeadless が有効になっている場合、ここで指定される要素が存在した場合はその要素に対して .click() が実行された後、改めて内容を評価し直します。特定のボタンを押さないと先に進めない場合などに利用します。

waitSecondInHeadless
isNeedHeadless が有効になっている場合、ページが読み込まれたと思われる後、さらにここで指定される数値で指定される秒数待った後にinnerHTMLを評価します。

injectStyle
pageElement で取り出した後のHTMLに対して強制的に適用するstyleを記述します。これは、pageElementで取り出した後のHTMLにはstyleが適用されない(パスが違うのでstyleが適用されないであるとか、pageElementで取り出されたHTMLにはstyleが無いであるとか、styleは別のファイルになっているのでGETリクエスト一回では取り出せないであるといったときに、white-space:pre-wrap; で指定されるようなコンテンツが入っているとHTMLからStringに変換した時に改行周りとかが省略されてしまって悲しいことになるという問題を回避するための物になります。(例えば、pageElement として <div class="content xxx yyy">...</div> が取り出されるのがわかっている場合、"div.content{white-space:pre-wrap;}" といったような値を指定する事を期待しています。

exampleUrl
対象のURLを書きます。後で動作確認などをする時に利用します。複数書く場合は半角スペースで区切ってください。

memo
何らかのメモ書きを残すべきと思った場合は書いておいてください。日本語でOKです。

また、次のページや最初のページを判定するための要素がいくつかあるのでそれらの優先順位を別途書き記しておきます。
優先される順序は

1. forceClickButton
2. nextButton
3. firstPageButton
4. nextLink
5. firstPageLink

の順(数字が若い方が優先)になります。

なお、ことせかいの動作としては、このデータベースとAutopagerizeのデータベースの両方を使ってデータを読み込むように作られています。
動作としては対象のURLについて、まずこちらのデータベースにあるものが優先され、こちらのデータベースに載っていないURLのものについてはAutopagerizeのデータベースを参照することになります。
ですので、Autopagerize側で定義されている情報で十分なものの場合は改めてこちら側のデータベースに登録する必要は無いかもしれません。