pageElement | //div[@class='content']/div[@class='detail']/div[@id]|//div[@class='content']//div[@class='box_banner_content'] |
---|---|
title | //div[@class='content']//div[@class='title'] |
waitSecondInHeadless | |
subtitle | |
nextButton | |
forceClickButton | |
firstPageLink | |
firstPageButton | |
memo | |
isNeedHeadless | |
nextLink | //div[contains(@class,'pagination')]//a[contains(@href,'/topics/') and child::span[@class='nextpostslink']]|//div[@class='detail']/div[@id='blocks_general_field']/div[contains(@class,'list-button')]//a[contains(@href,'/topics/')] |
url | ^https://febri\.jp/topics/[^/]+/ |
tag | //div[@class='list-outlink']//div[@class='list_tag']//li/a[contains(@href,'/topics_tags/')] |
author | |
injectStyle | |
exampleUrl | https://febri.jp/topics/thunderbolt-fantasy3_interview1/ |
Database: ことせかいWebページ読み込み用情報
ことせかい という読み上げアプリで利用するデータです。
Webで読める小説を取り込むために、文書の場所や次のページへのlinkなどをさすxpathを記述します。
幾つかの項目はAutopagerizeとほぼ同じ意味です。
ことせかい については以下のURLを参照してください。
http://limura.github.io/NovelSpeaker/
以下、個々の属性についての概ねの方針を書いておきます。
url
対象のURLしてヒットする正規表現を書きます。
pageElement
読み上げ対象となる文字列が含まれるエレメントを取り出すxpathを書きます。複数hitするようなxpathを書いた場合、その全てが取り出されます。
nextLink
次のページに続く場合のaタグを指定するxpathを書きます。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
Autopagerize側では必須属性になっていますが、こちらでは必須ではありません。つまり、Autopagerizeは(その目的から)1ページに全てが入っているサイトは登録されていませんので、そのようなサイトはこちらに登録する必要があります。また、Autopagerize側で主題が違う記事へのnextLinkが指定されているものについて、こちら側のデータベースにnextLinkが無い状態で登録することによって、主題が違う記事を読み込まないようにする事もできなくもありません。
title
本棚に登録される時の名前として採用される文字列を含むエレメントを取り出すためのxpathを書きます。
subtitle
(2017/12/18: 将来的に利用するための項目です)小説の個々の章にあたるサブタイトルを抽出できるエレメントを取り出すためのxpathを書きます。
author
作者名として採用される文字列を含むエレメントを指定するxpathを書きます。
firstPageLink
小説のタイトルページ(本文は含まない)がある場合、そのタイトルページから本文のページに遷移するためのaタグを指定します。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
注意:firstPageLink にヒットした場合、そのURLを読み直して評価をし直すため、無限に firstPageLink の読み込み先を読んで場合があります。そのようにならないように firstPageLink の xpath を指定してください。
tag
その小説等に関する文字列タグが列挙されているエレメントがある場合は指定します。将来的に小説の検索などに使われるタグとして利用されるつもりのものになります。幾つかターゲットを書いてみたところ、どうやら Aレコード でタグへのlinkになっているものが多いようで、その場合は内部にスペースがあるタグなども見受けられましたため、Aレコードのようなエレメント毎に一つのタグとして取り込めないかな?と思っています。ということでできればAレコードそのものを取り出すように(a/text() のような XPath を書いてテキストだけにしないように)して頂ければ幸いです。
isNeedHeadless
JavaScriptが動作した後に本文部分(pageElement)が生成される場合には何らかの値("true"が推奨)を入れます。"false" や "False", "nil", "0", ""(何も入れない) の場合には単にGETリクエストで取得された値について評価して良いという意味になります。
nextButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を次へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、nextLink よりも nextButton の方が先に評価されます(nextButton と nextLink が両方共に存在する場合は nextButton が優先されます)。
firstPageButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を最初の本文へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、firstPageLink よりも firstPageButton の方が先に評価されます(firstPageButton と firstPageLink が両方共に存在する場合は firstPageButton が優先されます)。
forceClickButton
(実験的機能なので将来的に変更される可能性があります)isNeedHeadless が有効になっている場合、ここで指定される要素が存在した場合はその要素に対して .click() が実行された後、改めて内容を評価し直します。特定のボタンを押さないと先に進めない場合などに利用します。
waitSecondInHeadless
isNeedHeadless が有効になっている場合、ページが読み込まれたと思われる後、さらにここで指定される数値で指定される秒数待った後にinnerHTMLを評価します。
injectStyle
pageElement で取り出した後のHTMLに対して強制的に適用するstyleを記述します。これは、pageElementで取り出した後のHTMLにはstyleが適用されない(パスが違うのでstyleが適用されないであるとか、pageElementで取り出されたHTMLにはstyleが無いであるとか、styleは別のファイルになっているのでGETリクエスト一回では取り出せないであるといったときに、white-space:pre-wrap; で指定されるようなコンテンツが入っているとHTMLからStringに変換した時に改行周りとかが省略されてしまって悲しいことになるという問題を回避するための物になります。(例えば、pageElement として <div class="content xxx yyy">...</div> が取り出されるのがわかっている場合、"div.content{white-space:pre-wrap;}" といったような値を指定する事を期待しています。
exampleUrl
対象のURLを書きます。後で動作確認などをする時に利用します。複数書く場合は半角スペースで区切ってください。
memo
何らかのメモ書きを残すべきと思った場合は書いておいてください。日本語でOKです。
また、次のページや最初のページを判定するための要素がいくつかあるのでそれらの優先順位を別途書き記しておきます。
優先される順序は
1. forceClickButton
2. nextButton
3. firstPageButton
4. nextLink
5. firstPageLink
の順(数字が若い方が優先)になります。
なお、ことせかい の動作としては、このデータベースとAutopagerizeのデータベースの両方を使ってデータを読み込むように作られています。
動作としては対象のURLについて、まずこちらのデータベースにあるものが優先され、こちらのデータベースに載っていないURLのものについてはAutopagerizeのデータベースを参照することになります。
ですので、Autopagerize側で定義されている情報で十分なものの場合は改めてこちら側のデータベースに登録する必要は無いかもしれません。
Last Update: 2024-04-16T12:03:19+09:00 History
Item List
-
Febri 2021-07-14T12:54:10+09:00
last update: 2021-07-14T12:54:10+09:00
-
弁護士ドットコムタイムズ 2021-07-12T14:00:29+09:00
pageElement //main//*[contains(@class,'articleDetail__discription') or contains(@class,'articleDetail__body') or contains(@class,'articleDetail__lastDescription') or contains(@class,'articleDetail__description')] title //main//header//h1 waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.bengo4\.com/times/articles/\d+/ tag author injectStyle exampleUrl https://www.bengo4.com/times/articles/318/ last update: 2021-07-12T14:00:29+09:00
-
GourmetBiz 2021-07-07T10:01:51+09:00
pageElement //div[@class='entry-content']/*[not(descendant::img) and not(descendant::iframe) and not(contains(@class,'addtoany_content'))] title //article//h1[@class='entry-title'] waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.gourmetbiz\.net/\d+/ tag //article//a[@rel='tag'] author injectStyle exampleUrl https://www.gourmetbiz.net/110081/ last update: 2021-07-07T10:01:51+09:00
-
FNN プライムオンライン 2021-07-05T16:03:47+09:00
pageElement //main/article/div[@class='article-body']/*[not(self::figure)] title //main/article/header//h1 waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.fnn\.jp/articles/-/\d+ tag //footer//div[contains(@class,'c-tag-wrap')]/a[@rel='tag'] author //main/article/header//a[contains(@href,'/author/')]/div[contains(@class,'author-ttl')] injectStyle exampleUrl https://www.fnn.jp/articles/-/205363 last update: 2021-07-05T16:03:47+09:00
-
POPEYE Magazone 2021-07-02T22:57:13+09:00
pageElement //article//section[not(contains(@class,'img-'))] title //article//h1 waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://popeyemagazine\.jp/post-\d+/ tag //article//p[@class='tag']/a[contains(@href,'/tag/')] author injectStyle exampleUrl https://popeyemagazine.jp/post-7497/ last update: 2021-07-02T22:57:13+09:00
-
NATIONAL GEOGRAPHIC(モバイル用?) 2021-07-02T16:14:07+09:00
title //section[@class='titleBox']/p[@class='title'] pageElement //div[@class='articleBody']/section/*[not(descendant::iframe) and not(@class='recommendBox') and not(@class='author') and not(@class='bpbox_center')] subtitle //section[@class='titleBox']/p[@class='lead'] url ^https://natgeo\.nikkeibp\.co\.jp/[^/]+/[^/]+/\d+/\d+/\?ST=m_news exampleUrl https://natgeo.nikkeibp.co.jp/atcl/news/16/033100118/?ST=m_news author //p[@class='author'] last update: 2021-07-02T16:19:07+09:00
-
STUDY HACKER 2021-06-30T11:43:58+09:00
pageElement //article//div[@class='entry-content'] title //article//header/h1 waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://studyhacker\.net/[^/]+ tag //article//header/div[contains(@class,'categories')]/a[contains(@href,'/category/')] author injectStyle exampleUrl https://studyhacker.net/working-sleepy last update: 2021-06-30T11:43:58+09:00
-
産経新聞 2021-06-22T09:09:55+09:00
pageElement //article//div[contains(@class,'article-body')]/p[contains(@class,'article-text')] title //article//h3[@class='article-headline'] waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink //article//div[contains(@class,'pagination')]/a[contains(@href,'/article/')] url ^https://www\.sankei\.com/article/\d+-[^/]+/ tag //article//div[contains(@class,'article-meta')]//a author injectStyle exampleUrl https://www.sankei.com/article/20210621-FFOXAKTHURJVRG3MQM3VJS2WJ4/ last update: 2021-06-22T09:09:55+09:00
-
WorldVoice 2021-06-21T09:02:38+09:00
pageElement //section//div[@class='wv-entry-body']/*[not(child::figure) and not(@class='cap') and not(self::script)] title //section//header/h3 waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.newsweekjapan\.jp/worldvoice/[^/]+/\d+/\d+/post- tag author //div[@class='wv-profile-txt']/dl/dt/a[contains(@href,'/')] injectStyle exampleUrl https://www.newsweekjapan.jp/worldvoice/hirano/2021/06/post-21.php last update: 2021-06-21T09:02:38+09:00
-
日本農業新聞 2021-06-09T15:15:54+09:00
pageElement //div[contains(@class,'hk-article-body')] title //h1[contains(@class,'article-title')] waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.agrinews\.co\.jp/[^/]+/[^/]+/\d+ tag author injectStyle exampleUrl https://www.agrinews.co.jp/society/index/10158 last update: 2021-06-09T15:15:54+09:00
-
STORIA法律事務所 blog 2021-05-31T16:03:50+09:00
pageElement //main/section//article/div[contains(@class,'contents_blog')] title //main/section//article/header//h3 waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://storialaw\.jp/blog/\d+ tag //main/section//article/header/p[@class='category']/text() author //main/section//article/div[@class='date_author']/span[contains(@class,'author')] injectStyle exampleUrl https://storialaw.jp/blog/7330 last update: 2021-05-31T16:03:50+09:00
-
SankeiBiz 2021-05-30T21:33:05+09:00
pageElement //main//article[@class='post']/div[@class='post_body']/p title //main//article[@class='post']/div[@class='post_header']/h2 waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink //main//article[@class='post']//div[@class='post_footer']/a[contains(@class,'more__btn')] url ^https://www\.sankeibiz\.jp/[^/]+/[^/]+/\d+/ tag author //main//article[@class='post']/div[@class='post_header']//div[@class='media_body']/a injectStyle exampleUrl https://www.sankeibiz.jp/business/news/210527/bsj2105270700001-n1.htm last update: 2021-05-30T21:33:05+09:00
-
pokenovel 2021-05-17T22:20:51+09:00
title //*[contains(@class,'ctshead')]/*[contains(@id,'title')] pageElement //*[@id='blank' or @class='line'] firstPageLink //*[contains(@href,'mode')][3] nextLink //*[contains(@align,’center’)]/* [contains(text(),'NEXT')] url ^http://pokenovel.moo.jp/mtsm/ author //*[contains(@class,'menu')]/*[@style]/*[contains(@href,'mode=profile')] last update: 2021-07-20T21:32:30+09:00
-
藤本健の “DTMステーション” 2021-05-08T07:05:06+09:00
pageElement //main/article/section[contains(@class,'entry-content')] title //header//h1[contains(@class,'entry-title')] waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.dtmstation\.com/archives/\d+.html tag //footer/div[@class='tags']/a[contains(@href,'/tag/') and @title] author injectStyle exampleUrl https://www.dtmstation.com/archives/34908.html last update: 2021-05-08T07:05:06+09:00
-
共同通信社 2021-05-06T11:43:54+09:00
pageElement //article title //h1[@class='main__title'] waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://this\.kiji\.is/\d+ tag author //div[@class='main__titleWrapper']//p[@class='main__publisher'] injectStyle exampleUrl https://this.kiji.is/762850499815833600 last update: 2021-05-06T11:43:54+09:00
-
SciencePortal 2021-05-04T23:03:04+09:00
pageElement //main//div[@class='p-article-body']/*[not(child::figure) and not(@class='mod-link')] title //main//h1 waitSecondInHeadless subtitle nextButton forceClickButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://scienceportal\.jst\.go\.jp/gateway/clip/[^/]+/ tag //div[@class='p-article-tags']//li/a[@class='p-article-tags__link'] author //main//span[@class='p-article-header__author-name'] injectStyle exampleUrl https://scienceportal.jst.go.jp/gateway/clip/20210128_g01/index.html last update: 2021-05-04T23:03:04+09:00
-
Gadget Touch 2021-04-30T14:26:34+09:00
pageElement //div[@itemprop='articleBody']/*[not(@id='bottom-related') and not(self::img) and not(self::figure)] title //h1[@class='entry-header-title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://gadget-touch\.info/\d+/\d+/\d+/[^/]+/ tag //aside[@class='entry-footer-category']/a[contains(@href,'/category/')] author injectStyle exampleUrl https://gadget-touch.info/2021/04/29/device-only-buy/ last update: 2021-04-30T14:26:34+09:00
-
ベストカーWeb 2021-04-27T14:49:19+09:00
title //h1[@class='article__title'] pageElement //div[@class='article__content']/*[not(self::script) and not(descendant::figure) and not(@class='pagination') and not(self::style)] nextLink //div[@class='pagination']//li[@class='next']/a[contains(@href,'prd=')] tag //article//ul[@class='tag']/li[@class='tag__item']/a[contains(@href,'/tags/')] url ^https://bestcarweb\.jp/[^/]+/[^/]+/\d+ exampleUrl https://bestcarweb.jp/feature/column/275455 author //article//div[@class='article__author']//p[@class='article__authorName'] last update: 2021-04-27T14:52:36+09:00
-
まいどなニュース 2021-04-27T14:40:30+09:00
pageElement //div[@class='module-article-body'] title //h1[@class='module-article-header__heading'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://maidonanews\.jp/article/\d+ tag author //div[@class='module-article-header__credit']/a[contains(@href,'/writer/') and @id='author']/span[@class='module-article-header__credit__name'] injectStyle exampleUrl https://maidonanews.jp/article/14336399 last update: 2021-04-27T14:40:30+09:00
-
ウマフリ 2021-04-05T11:46:56+09:00
pageElement //div[@class='content'] title //h1[contains(@class,'entry-title')] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://uma-furi.com/furusato-guide/ tag author //header//ul/li[contains(@class,'author-name')]/a[contains(@href,'/author/')] injectStyle exampleUrl https://uma-furi.com/furusato-guide/ last update: 2021-04-05T11:46:56+09:00
-
TechRacho 2021-04-01T20:26:43+09:00
pageElement //div[@id='js-single-body'] title //h1[@class='single-header-title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://techracho\.bpsinc\.jp/[^/]+/\d+_\d+_\d+/\d+ tag //div[@class='single-footer-tag']//ul/li/a[contains(@href,'/tag/')] author //div[@class='single-header-coauthor-list']//li/a[contains(@href,'/author/')]/div[@class='single-header-coauthor-text'] injectStyle exampleUrl https://techracho.bpsinc.jp/wingdoor/2021_04_01/106337 last update: 2021-04-01T20:26:43+09:00
-
MOVIE WALKER 2021-03-24T00:01:19+09:00
pageElement //div[@class='un_newsDetail_content']/*[not(self::figure) and not(contains(@class,'newsDetail_pic_btnWrap'))] title //div[@class='un_newsDetail_head_ttl']/h1[contains(@class,'newsDetail_lv1Heading')] waitSecondInHeadless subtitle //div[@class='un_newsDetail_head_ttl']/h1[contains(@class,'newsDetail_lv1Heading')] nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //a[@class='un_newsDetail_link' and contains(@href,'/news/article/') and contains(@href,'/p') and child::div[@class='un_newsDetail_link_arw']] url ^https://moviewalker\.jp/news/article/\d+/ tag //div[@class='un_newsDetailKeyword']/ul/li/a[contains(@href,'/tags/')] author injectStyle exampleUrl https://moviewalker.jp/news/article/1025469/ last update: 2021-03-24T00:01:19+09:00
-
神戸新聞NEXT 2021-03-23T10:55:26+09:00
pageElement //div[@class='textDetail'] title //div[@class='genreTitle']/div[@class='genreNews']/a[not(@class) and contains(@href,'/news/')] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.kobe-np\.co\.jp/news/[^/]+/\d+/\d+ tag author injectStyle exampleUrl https://www.kobe-np.co.jp/news/sougou/202103/0014171674.shtml last update: 2021-03-23T10:55:26+09:00
-
@WIK! 2021-03-20T15:46:13+09:00
pageElement //div[@id='wikibody'] title //title waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://w\.atwiki\.jp/[^/]+/pages/\d+ tag author injectStyle exampleUrl https://w.atwiki.jp/aniwotawiki/pages/44046.html last update: 2021-03-20T15:46:13+09:00
-
PlayStation.Blog 2021-03-19T14:24:28+09:00
title //div[@class='post-single__header']//h1[@class='post-single__title'] pageElement //div[@class='article-main-section']/div[contains(@class,'post-single__content')]/*[not(descendant::img)] tag //div[@class='post-footer']/div[@class='post-footer__tags']/a[@class='post-tag'] url ^https://blog\.ja\.playstation\.com/\d+/\d+/\d+/[^/]+/ exampleUrl https://blog.ja.playstation.com/2021/03/18/20210318-ps/ author //div[@class='sub-header-wrap']//div[contains(@class,'post-single__author-byline')]//a[@class='author-name' and contains(@href,'/author/')] last update: 2021-03-19T14:27:34+09:00
-
時事メディカル 2021-03-19T09:23:18+09:00
pageElement //main/div[@class='bootstrap']/p[not(@class='articleDate') and not(contains(text(),'【関連記事】\n'))] title //main/h1[@class='articleTitle'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://medical\.jiji\.com/topics/\d+ tag //main/p/a[contains(@class,'topicsIcon') and contains(@href,'/topics/')] author injectStyle exampleUrl https://medical.jiji.com/topics/1982 last update: 2021-03-19T09:23:18+09:00
-
虚構新聞 2021-03-17T23:13:56+09:00
title //article/h1 pageElement //article/text()|//article/div[@style]/div/text() url ^https://kyoko-np\.net/\d+\.html exampleUrl https://kyoko-np.net/2021031701.html last update: 2021-03-17T23:20:11+09:00
-
通販新聞 2021-03-01T15:47:13+09:00
pageElement //div[@class='article_detail']//div[contains(@class,'main_comment')] title //h2[@class='title_line'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.tsuhanshimbun\.com/products/article_detail\.php\?product_id=\d+ tag //div[@id='detailarea']/ul[@class='tag_area']//a[contains(@href,'?name=')] author injectStyle exampleUrl https://www.tsuhanshimbun.com/products/article_detail.php?product_id=5662&_ssd=1 last update: 2021-03-01T15:47:13+09:00
-
介護ポストセブン 2021-03-01T15:31:46+09:00
pageElement //main/div[@class='mainbody']/*[not(self::figure) and not(descendant::iframe) and not(descendant::noscript) and not(self::ul[@class='clips']) and not(self::div[contains(@class,'amazonjs')])] title //main/div[@class='head']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://kaigo\.news-postseven\.com/\d+ tag //main/div[@class='mainbody']/ul[@class='clips']//a[contains(@href,'/tagid?')] author injectStyle exampleUrl https://kaigo.news-postseven.com/90389 last update: 2021-03-01T15:31:46+09:00
-
税理士ドットコム 2021-02-25T15:32:03+09:00
pageElement //article//div[@data-article='body']/*[not(contains(@class,'imageWrap')) and not(contains(@class,'bodyAdContainer'))] title //article/header/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.zeiri4\.com/[^/]+/[^/]+/ tag //header/div[contains(@class,'infoHeader')]/p[contains(@class,'category')] author injectStyle exampleUrl https://www.zeiri4.com/c_3/n_972/ last update: 2021-02-25T15:32:03+09:00
-
東京新聞 2021-02-20T17:49:39+09:00
title //main/div[@class='heading-area']//h1 pageElement //div[@id='entry']/div[@class='block' and not(self::div[contains(text(),'【関連記事】') and child::a[contains(@href,'https://www.tokyo-np.co.jp/article/')]]) and not(descendant::ul/li/div/a[contains(@href,'/n/') or contains(@href,'/tags/')])] nextLink //div[@class='pager']//a[contains(@href,'/article/') and descendant::i[contains(@class,'fa-arrow-right')]] tag //div[@id='entry']/div[@class='block']//ul/li//a[contains(@href,'/n/') or contains(@href,'/tags/')] url ^https://www\.tokyo-np\.co\.jp/article/\d+ last update: 2021-05-25T08:51:45+09:00
-
AstroArts 2021-02-13T21:05:50+09:00
pageElement //section[@id='article']/div[@class='body' or @class='summary'] title //section[@id='article']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https?://www\.astroarts\.co\.jp/article/[^/]+/[^/]+/\d+_ tag //div[@id='tags']/ul/li/a[contains(@href,'/t/')] author injectStyle exampleUrl last update: 2021-02-13T21:05:50+09:00
-
アゴラ 2021-02-10T11:37:25+09:00
pageElement //div[contains(@class,'articleContent')]/*[not(contains(@id,'attachment_'))] title //div[@class='title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https?://agora-web\.jp/archives/\d+\.html tag //div[contains(@class,'categoryList')]//li/a[contains(@href,'/category/')] author //div[contains(@class,'articleTop')]//div[@class='author']/a[contains(@href,'/author/')] injectStyle exampleUrl http://agora-web.jp/archives/2050167.html last update: 2021-02-10T11:37:25+09:00
-
CORAL 2021-02-10T11:09:05+09:00
title //h1 pageElement //div[contains(@class,'coral_blog_main_content')]|//div[contains(@class,'content_0_tb_body')]/*[not(contains(@id,'attachment_')) and not(@data-author-type='user')] tag //a[@class='coral_blog_tags' and contains(@href,'/tag/')] url ^https://coralcap\.co/\d+/\d+/ exampleUrl https://coralcap.co/2021/02/when-non-technical-founders-write-code/ https://coralcap.co/2022/05/hidemaru-01/ author //div[contains(@class,'author-bio-social')]|//h5/a[contains(@href,'/author/') and @data-wpel-link='internal'] last update: 2022-05-11T17:42:30+09:00
-
monogatary.com 2021-02-01T10:11:44+09:00
waitSecondInHeadless 1.0 title //main//article//div[@class='story-header']//h2[@class='story-header__title-sub'] pageElement //main//article//div[@class='story-section__content'] subtitle //main//article//div[@class='story-header']//h1[@class='story-header__title-name'] firstPageLink //main//div[@class='write-section__button-box'][1]/a isNeedHeadless true nextLink //main//article/nav[@class='nav-chapter']/a[contains(@class,'link--next') and contains(@href,'/episode/')] url ^https://monogatary\.com/(story|episode)/\d+ exampleUrl https://monogatary.com/episode/38870 https://monogatary.com/story/33826 author //main//article/div[contains(@class,'popular-user')]//div[@class='popular-user__name']/a[contains(@href,'/user_page/')]/div[contains(@class,'popular-user__name-text')] last update: 2022-12-16T20:22:30+09:00
-
wattpad 2021-01-26T00:20:40+09:00
title //h3[@class='item-title'] pageElement //div[contains(@class,'panel-reading')]/pre subtitle //header/h1[@class='h2'] firstPageLink //div[@class='story-parts']//ul[@class='table-of-contents']/li/a[contains(@class,'on-navigate-part')] isNeedHeadless true nextLink //a[contains(@class,'next-part')] tag //p[@class='item-tags']/span[@class='tag'] url ^https://www\.wattpad\.com/(story/)?\d+- exampleUrl https://www.wattpad.com/story/115801661-c%C3%B4-g%C3%A1i-tr%C4%83ng-khuy%E1%BA%BFt-m%C6%B0%E1%BB%9Di-hai-cung-ho%C3%A0ng-%C4%91%E1%BA%A1o-full injectStyle .comment-marker.hide-marker { display: none; }; figure { display: none; }; figcaption { display: none; } author //div[contains(@class,'author')]/a[@class='on-navigate' and contains(@href,'/user/')] last update: 2021-01-26T00:31:33+09:00
-
マグミクス 2021-01-24T15:12:00+09:00
title //main//article/h1[@class] pageElement //article//p[@class='post-excerpt']|//article//div[@id='detail-text']/div[@class='paragraph']/*[not(self::figure)] nextLink //article//div[@id='detail-text']/div[@class='nextpage']/a[contains(@href,'/post/')] tag //main//section[@id='article-meta']/div[contains(@class,'article-tags')]/a[@rel='tag' and contains(@href,'/tag/')] url ^https://magmix\.jp/post/\d+ exampleUrl https://magmix.jp/post/45088 https://magmix.jp/post/45256 last update: 2021-01-24T15:17:26+09:00
-
ラジオライフ.com 2021-01-16T22:51:05+09:00
pageElement //div[@id='posts']/div[@class='post']/*[self::h2 or self::p] title //div[@id='posts']/div[@class='post']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://radiolife\.com/[^/]+/[^/]+/\d+/ tag author injectStyle exampleUrl https://radiolife.com/internet/amazon/45201/ last update: 2021-01-16T22:51:05+09:00
-
DeNA エンジニアブログ 2021-01-14T14:17:44+09:00
pageElement //main//div[@class='article-body'] title //main//div[@class='article-header']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://engineer\.dena\.com/posts/ tag //main//div[@class='article-header']//a[contains(@href,'/tags/')] author //div[@class='article-footer']//a[contains(@href,'/authors/')] injectStyle exampleUrl https://engineer.dena.com/posts/2021.01/kencom-hoken-team-building/ last update: 2021-01-14T14:17:44+09:00
-
テレ朝 news 2020-12-18T11:48:48+09:00
pageElement //div[@class='main-container']/section//div[@id='news_body'] title //h1[@id='news_title']/text() waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://news\.tv-asahi\.co\.jp/news_[a-z]+/articles/\d+.html tag author injectStyle exampleUrl https://news.tv-asahi.co.jp/news_society/articles/000201643.html last update: 2020-12-18T11:48:48+09:00
-
Novelism 2020-12-14T23:13:33+09:00
title //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//h1 pageElement //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//div[contains(@class,'v-reader-content-container')] subtitle //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//h2[contains(@class,'v-reader-title')] firstPageLink //*[contains(@class,'table-of-contents')]//li[@id]//a[contains(@href,'/novel/') and contains(@href,'/article/')] isNeedHeadless true nextLink //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//a[contains(@class,'v-reader-pagination-link') and contains(@class,'justify-end')] tag //a[contains(@href,'/keyword/')] url ^https://novelism\.jp/novel/[^/]+/ exampleUrl https://novelism.jp/novel/PZZjgtOjR5aQavm7ruz1kA/ author //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//div[contains(@class,'avatar')]/span last update: 2021-04-11T13:59:53+09:00
-
好きな物語と出会えるサイト tree 2020-12-06T22:52:41+09:00
pageElement //div[@id='main']//div[@class='episode']/div[@class='inner'] title //div[@id='main']/div[@class='header']//div[@class='title']//a[contains(@href,'/works/')] waitSecondInHeadless subtitle //div[@id='main']//div[@class='episode']/h1 nextButton firstPageLink //div[@class='m-navTab__content']//div[@class='contents']/ol/li/a[contains(@href,'/works/episode/')] firstPageButton memo isNeedHeadless nextLink //div[@id='main']//div[contains(@class,'next')]//p[@class='arrowR']/a[contains(@href,'/works/episode/')] url ^https://tree-novel\.com/works/ tag author //div[@id='side']//div[contains(@class,'title')]/div[contains(@class,'author')]/a[contains(@href,'/author/')] injectStyle exampleUrl https://tree-novel.com/works/691094fcfc4b309954a8121ab4d1eb7a.html last update: 2020-12-06T22:52:41+09:00
-
CyberAgent Developers Blog 2020-11-27T17:30:46+09:00
pageElement //article[@id and contains(@class,'cadev-entry')]/div[@class='entry-content']/*[not(self::figure) and not(self::footer) and not(@class='nav-links')] title //article[@id and contains(@class,'cadev-entry')]/header//h1[@class='entry-title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://developers\.cyberagent\.co\.jp/blog/archives/\d+/ tag //article[@id and contains(@class,'cadev-entry')]/div[@class='entry-content']/footer[@class='entry-footer']/ul[@class='tags']/li/a[@rel='tag'] author //article[@id and contains(@class,'cadev-entry')]/div[@class='entry-content']/footer[@class='entry-footer']//a[contains(@href,'/author/')] injectStyle exampleUrl https://developers.cyberagent.co.jp/blog/archives/27782/ last update: 2020-11-27T17:30:46+09:00
-
SEGA TECH BLOG 2020-11-25T18:13:38+09:00
pageElement //div[@class='entry-content']/*[not(self::figure) and not(child::iframe)] title //h1[@class='entry-title']/a[contains(@href,'/entry/')] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //div[contains(@class,'pager-permalink')]/span[@class='pager-prev']/a[contains(@href,'/entry/') and @rel='prev'] url ^https?://techblog\.sega\.jp/entry/\d+/\d+/\d+/\d+ tag //div[contains(@class,'entry-categories')]/a[contains(@href,'/category/')] author //footer[@class='entry-footer']//span[@class='user-name-nickname'] injectStyle exampleUrl http://techblog.sega.jp/entry/2020/11/25/100000 last update: 2020-11-25T18:13:38+09:00
-
btrax blog 2020-11-25T17:56:35+09:00
title //header/h1 pageElement //div[contains(@class,'wp_content_tag')] tag //main/article//header/p[contains(@class,'header__category')]/a[contains(@href,'/category/')] url ^https://blog\.btrax\.com/jp/[^/]+/ exampleUrl https://blog.btrax.com/jp/google-vs-apple/ author //div[@class='oneArticle__text__author']//p[contains(@class,'author__name')]/a[contains(@href,'/author/')] last update: 2021-06-14T09:01:11+09:00
-
BUSINESS INSIDER 2020-11-11T17:42:39+09:00
title //article[@class='p-post']/h1[@class='p-post-title'] pageElement //article[@class='p-post']//div[contains(@class,'p-post-content')]/*[not(contains(@class,'contentFigure')) and not(self::style) and not(@class='ogp')] tag //div[@class='p-post-tag']/ul[@class='p-post-tagList']/li[@class='p-post-tagItem']/a url ^https://www\.businessinsider\.jp/post- exampleUrl https://www.businessinsider.jp/post-223942 author //article[@class='p-post']/div[@class='p-post-byline']//li/a[contains(@href,'/author/')] last update: 2022-02-14T12:47:45+09:00
-
朝日新聞 EduA 2020-11-08T21:16:42+09:00
pageElement //article//div[contains(@class,'article-detail__body-inner')]/p title //article[@class='article-detail']//h1[contains(@class,'article-detail__caption')] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //nav[@class='pager']/p[contains(@class,'pager__next')]/a url ^https://www\.asahi\.com/edua/article/[0-9]+ tag //article[@class='article-detail']//div[contains(@class,'article-detail__head-row')]/ul[@class='article-detail__tag-list']/li/a[contains(@href,'/edua/tag/')] author //article[@class='article-detail']//div[@class='article-detail__author']/a[contains(@href,'/edua/author/')]//figcaption injectStyle exampleUrl https://www.asahi.com/edua/article/13899713?iref=pc_ss_date last update: 2020-11-08T21:16:42+09:00
-
Berry's Cafe(スマートフォン) 2020-10-28T01:11:51+09:00
title //div[@id='wrapper']/div[@id='content']/div[@id='content-header']/h2|//h1[@id='top'] pageElement //div[@id='content']//div[contains(@class,'content-body')]|//div[@id='content']/p[@class='bodyText'] subtitle //div[@id='wrapper']/div[@id='content']/div[@id='content-header']/p[@class='chapter']|//div[@id='wrapper']/div[@id='header']/h3[contains(@class,'sectionTit')] firstPageLink //dl[@class='chapterLink']/dt/a nextLink //div[@id='wrapper']/div[@id='content']//ul[contains(@class,'pageLink')]/li[@class='pageLinkR']/a[contains(@href,'/book/')]|//div[@id='book-footer']//a[contains(@class,'next')] tag //div[@id='content-footer']//ul/li/a[contains(@href,'/search/search.htm') and contains(@href,'word=')] url ^https://www\.berrys-cafe\.jp/spn/book/[^/]+/ exampleUrl https://www.berrys-cafe.jp/spn/book/n1618206/ author //div[@id='content-header']//div[@class='bookDetail']//span[@itemprop='author']/a[contains(@href,'/reader/profile.htm')] last update: 2023-05-25T23:47:41+09:00
-
Berry's Cafe(PC) 2020-10-28T00:30:41+09:00
title //div[@class='title'] pageElement //div[@class='bookBody'] subtitle //div[@class='chapterTit'] firstPageLink //div[@id='contents-block']/ul/li/a nextLink //div[@class='bookFoot']//div[@class='next']/a[contains(@href,'/book/')] tag //section/div[@class='bookKeywordList']//li/a[contains(@href,'/search/') and contains(@href,'word=')] url ^https://www\.berrys-cafe\.jp/(pc/)?book/[^/]+/ exampleUrl https://www.berrys-cafe.jp/pc/book/n1618206/ author //h2[@itemprop='author']/a[contains(@href,'/profile')] last update: 2023-05-25T23:45:16+09:00
-
アニメハック/ニュース 2020-10-27T03:51:32+09:00
pageElement //div[contains(@class,'newsDetailBox')]/*[not(contains(@class,'newsDetailPhotoArea')) and not(contains(@class,'youtubeFrame')) and not(contains(@class,'pageInfoArea'))] title //div[@class='headArea']//h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //div[contains(@class,'pagination')]/span[@class='next_page']/a[@rel='next'] url ^https://anime\.eiga\.com/news/[0-9]+/ tag //div[@class='tagArea']/ul/li/a author injectStyle exampleUrl https://anime.eiga.com/news/112131/ last update: 2020-10-27T03:51:32+09:00