pageElement | //div[@class='content'] |
---|---|
title | //h1[contains(@class,'entry-title')] |
waitSecondInHeadless | |
subtitle | |
nextButton | |
firstPageLink | |
firstPageButton | |
memo | |
isNeedHeadless | |
nextLink | |
url | ^https://uma-furi.com/furusato-guide/ |
tag | |
author | //header//ul/li[contains(@class,'author-name')]/a[contains(@href,'/author/')] |
injectStyle | |
exampleUrl | https://uma-furi.com/furusato-guide/ |
Database: ことせかいWebページ読み込み用情報
ことせかい という読み上げアプリで利用するデータです。
Webで読める小説を取り込むために、文書の場所や次のページへのlinkなどをさすxpathを記述します。
幾つかの項目はAutopagerizeとほぼ同じ意味です。
ことせかい については以下のURLを参照してください。
http://limura.github.io/NovelSpeaker/
以下、個々の属性についての概ねの方針を書いておきます。
url
対象のURLしてヒットする正規表現を書きます。
pageElement
読み上げ対象となる文字列が含まれるエレメントを取り出すxpathを書きます。複数hitするようなxpathを書いた場合、その全てが取り出されます。
nextLink
次のページに続く場合のaタグを指定するxpathを書きます。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
Autopagerize側では必須属性になっていますが、こちらでは必須ではありません。つまり、Autopagerizeは(その目的から)1ページに全てが入っているサイトは登録されていませんので、そのようなサイトはこちらに登録する必要があります。また、Autopagerize側で主題が違う記事へのnextLinkが指定されているものについて、こちら側のデータベースにnextLinkが無い状態で登録することによって、主題が違う記事を読み込まないようにする事もできなくもありません。
title
本棚に登録される時の名前として採用される文字列を含むエレメントを取り出すためのxpathを書きます。
subtitle
(2017/12/18: 将来的に利用するための項目です)小説の個々の章にあたるサブタイトルを抽出できるエレメントを取り出すためのxpathを書きます。
author
作者名として採用される文字列を含むエレメントを指定するxpathを書きます。
firstPageLink
小説のタイトルページ(本文は含まない)がある場合、そのタイトルページから本文のページに遷移するためのaタグを指定します。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
注意:firstPageLink にヒットした場合、そのURLを読み直して評価をし直すため、無限に firstPageLink の読み込み先を読んで場合があります。そのようにならないように firstPageLink の xpath を指定してください。
tag
その小説等に関する文字列タグが列挙されているエレメントがある場合は指定します。将来的に小説の検索などに使われるタグとして利用されるつもりのものになります。幾つかターゲットを書いてみたところ、どうやら Aレコード でタグへのlinkになっているものが多いようで、その場合は内部にスペースがあるタグなども見受けられましたため、Aレコードのようなエレメント毎に一つのタグとして取り込めないかな?と思っています。ということでできればAレコードそのものを取り出すように(a/text() のような XPath を書いてテキストだけにしないように)して頂ければ幸いです。
isNeedHeadless
(実験的機能なので将来的に変更される可能性があります)JavaScriptが動作した後に本文部分(pageElement)が生成される場合には何らかの値("true"が推奨)を入れます。"false" や "False", "nil", "0", ""(何も入れない) の場合には単にGETリクエストで取得された値について評価して良いという意味になります。
nextButton
(実験的機能なので将来的に変更される可能性があります)isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を次へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、nextLink よりも nextButton の方が先に評価されます(nextButton と nextLink が両方共に存在する場合は nextButton が優先されます)。
firstPageButton
(実験的機能なので将来的に変更される可能性があります)isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を最初の本文へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、firstPageLink よりも firstPageButton の方が先に評価されます(firstPageButton と firstPageLink が両方共に存在する場合は firstPageButton が優先されます)。
waitSecondInHeadless
(実験的機能なので将来的に変更される可能性があります)isNeedHeadless が有効になっている場合、ページが読み込まれたと思われる後、さらにここで指定される数値で指定される秒数待った後にinnerHTMLを評価します。
injectStyle
pageElement で取り出した後のHTMLに対して強制的に適用するstyleを記述します。これは、pageElementで取り出した後のHTMLにはstyleが適用されない(パスが違うのでstyleが適用されないであるとか、pageElementで取り出されたHTMLにはstyleが無いであるとか、styleは別のファイルになっているのでGETリクエスト一回では取り出せないであるといったときに、white-space:pre-wrap; で指定されるようなコンテンツが入っているとHTMLからStringに変換した時に改行周りとかが省略されてしまって悲しいことになるという問題を回避するための物になります。(例えば、pageElement として <div class="content xxx yyy">...</div> が取り出されるのがわかっている場合、"div.content{white-space:pre-wrap;}" といったような値を指定する事を期待しています。
exampleUrl
対象のURLを書きます。後で動作確認などをする時に利用します。複数書く場合は半角スペースで区切ってください。
memo
何らかのメモ書きを残すべきと思った場合は書いておいてください。日本語でOKです。
また、次のページや最初のページを判定するための要素がいくつかあるのでそれらの優先順位を別途書き記しておきます。
優先される順序は
1. nextButton
2. firstPageButton
3. nextLink
4. firstPageLink
の順(数字が若い方が優先)になります。
なお、ことせかい の動作としては、このデータベースとAutopagerizeのデータベースの両方を使ってデータを読み込むように作られています。
動作としては対象のURLについて、まずこちらのデータベースにあるものが優先され、こちらのデータベースに載っていないURLのものについてはAutopagerizeのデータベースを参照することになります。
ですので、Autopagerize側で定義されている情報で十分なものの場合は改めてこちら側のデータベースに登録する必要は無いかもしれません。
Last Update: 2021-04-19T21:34:28+09:00 History
Item List
-
ウマフリ 2021-04-05T11:46:56+09:00
last update: 2021-04-05T11:46:56+09:00
-
TechRacho 2021-04-01T20:26:43+09:00
pageElement //div[@id='js-single-body'] title //h1[@class='single-header-title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://techracho\.bpsinc\.jp/[^/]+/\d+_\d+_\d+/\d+ tag //div[@class='single-footer-tag']//ul/li/a[contains(@href,'/tag/')] author //div[@class='single-header-coauthor-list']//li/a[contains(@href,'/author/')]/div[@class='single-header-coauthor-text'] injectStyle exampleUrl https://techracho.bpsinc.jp/wingdoor/2021_04_01/106337 last update: 2021-04-01T20:26:43+09:00
-
MOVIE WALKER 2021-03-24T00:01:19+09:00
pageElement //div[@class='un_newsDetail_content']/*[not(self::figure) and not(contains(@class,'newsDetail_pic_btnWrap'))] title //div[@class='un_newsDetail_head_ttl']/h1[contains(@class,'newsDetail_lv1Heading')] waitSecondInHeadless subtitle //div[@class='un_newsDetail_head_ttl']/h1[contains(@class,'newsDetail_lv1Heading')] nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //a[@class='un_newsDetail_link' and contains(@href,'/news/article/') and contains(@href,'/p') and child::div[@class='un_newsDetail_link_arw']] url ^https://moviewalker\.jp/news/article/\d+/ tag //div[@class='un_newsDetailKeyword']/ul/li/a[contains(@href,'/tags/')] author injectStyle exampleUrl https://moviewalker.jp/news/article/1025469/ last update: 2021-03-24T00:01:19+09:00
-
神戸新聞NEXT 2021-03-23T10:55:26+09:00
pageElement //div[@class='textDetail'] title //div[@class='genreTitle']/div[@class='genreNews']/a[not(@class) and contains(@href,'/news/')] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.kobe-np\.co\.jp/news/[^/]+/\d+/\d+ tag author injectStyle exampleUrl https://www.kobe-np.co.jp/news/sougou/202103/0014171674.shtml last update: 2021-03-23T10:55:26+09:00
-
@WIK! 2021-03-20T15:46:13+09:00
pageElement //div[@id='wikibody'] title //title waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://w\.atwiki\.jp/[^/]+/pages/\d+ tag author injectStyle exampleUrl https://w.atwiki.jp/aniwotawiki/pages/44046.html last update: 2021-03-20T15:46:13+09:00
-
PlayStation.Blog 2021-03-19T14:24:28+09:00
title //div[@class='post-single__header']//h1[@class='post-single__title'] pageElement //div[@class='article-main-section']/div[contains(@class,'post-single__content')]/*[not(descendant::img)] tag //div[@class='post-footer']/div[@class='post-footer__tags']/a[@class='post-tag'] url ^https://blog\.ja\.playstation\.com/\d+/\d+/\d+/[^/]+/ exampleUrl https://blog.ja.playstation.com/2021/03/18/20210318-ps/ author //div[@class='sub-header-wrap']//div[contains(@class,'post-single__author-byline')]//a[@class='author-name' and contains(@href,'/author/')] last update: 2021-03-19T14:27:34+09:00
-
時事メディカル 2021-03-19T09:23:18+09:00
pageElement //main/div[@class='bootstrap']/p[not(@class='articleDate') and not(contains(text(),'【関連記事】\n'))] title //main/h1[@class='articleTitle'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://medical\.jiji\.com/topics/\d+ tag //main/p/a[contains(@class,'topicsIcon') and contains(@href,'/topics/')] author injectStyle exampleUrl https://medical.jiji.com/topics/1982 last update: 2021-03-19T09:23:18+09:00
-
虚構新聞 2021-03-17T23:13:56+09:00
title //article/h1 pageElement //article/text()|//article/div[@style]/div/text() url ^https://kyoko-np\.net/\d+\.html exampleUrl https://kyoko-np.net/2021031701.html last update: 2021-03-17T23:20:11+09:00
-
通販新聞 2021-03-01T15:47:13+09:00
pageElement //div[@class='article_detail']//div[contains(@class,'main_comment')] title //h2[@class='title_line'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.tsuhanshimbun\.com/products/article_detail\.php\?product_id=\d+ tag //div[@id='detailarea']/ul[@class='tag_area']//a[contains(@href,'?name=')] author injectStyle exampleUrl https://www.tsuhanshimbun.com/products/article_detail.php?product_id=5662&_ssd=1 last update: 2021-03-01T15:47:13+09:00
-
介護ポストセブン 2021-03-01T15:31:46+09:00
pageElement //main/div[@class='mainbody']/*[not(self::figure) and not(descendant::iframe) and not(descendant::noscript) and not(self::ul[@class='clips']) and not(self::div[contains(@class,'amazonjs')])] title //main/div[@class='head']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://kaigo\.news-postseven\.com/\d+ tag //main/div[@class='mainbody']/ul[@class='clips']//a[contains(@href,'/tagid?')] author injectStyle exampleUrl https://kaigo.news-postseven.com/90389 last update: 2021-03-01T15:31:46+09:00
-
税理士ドットコム 2021-02-25T15:32:03+09:00
pageElement //article//div[@data-article='body']/*[not(contains(@class,'imageWrap')) and not(contains(@class,'bodyAdContainer'))] title //article/header/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.zeiri4\.com/[^/]+/[^/]+/ tag //header/div[contains(@class,'infoHeader')]/p[contains(@class,'category')] author injectStyle exampleUrl https://www.zeiri4.com/c_3/n_972/ last update: 2021-02-25T15:32:03+09:00
-
東京新聞 2021-02-20T17:49:39+09:00
pageElement //div[@id='entry']/div[@class='block' and not(self::div[contains(text(),'【関連記事】') and child::a[contains(@href,'https://www.tokyo-np.co.jp/article/')]]) and not(descendant::ul/li/div/a[contains(@href,'/n/') or contains(@href,'/tags/')])] title //main/div[@class='heading-area']//h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.tokyo-np\.co\.jp/article/\d+ tag //div[@id='entry']/div[@class='block']//ul/li//a[contains(@href,'/n/') or contains(@href,'/tags/')] author injectStyle exampleUrl last update: 2021-02-20T17:49:39+09:00
-
AstroArts 2021-02-13T21:05:50+09:00
pageElement //section[@id='article']/div[@class='body' or @class='summary'] title //section[@id='article']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https?://www\.astroarts\.co\.jp/article/[^/]+/[^/]+/\d+_ tag //div[@id='tags']/ul/li/a[contains(@href,'/t/')] author injectStyle exampleUrl last update: 2021-02-13T21:05:50+09:00
-
アゴラ 2021-02-10T11:37:25+09:00
pageElement //div[contains(@class,'articleContent')]/*[not(contains(@id,'attachment_'))] title //div[@class='title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https?://agora-web\.jp/archives/\d+\.html tag //div[contains(@class,'categoryList')]//li/a[contains(@href,'/category/')] author //div[contains(@class,'articleTop')]//div[@class='author']/a[contains(@href,'/author/')] injectStyle exampleUrl http://agora-web.jp/archives/2050167.html last update: 2021-02-10T11:37:25+09:00
-
CORAL 2021-02-10T11:09:05+09:00
pageElement //div[@class='wpb_wrapper']/div[contains(@class,'vcex-post-content')] title //h1[contains(@class,'vcex-heading')] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://coralcap\.co/\d+/\d+/ tag //div[contains(@class,'vcex-post-terms')]/a[contains(@href,'/tag/')] author //h4[contains(@class,'author-bio-title')]/a[contains(@href,'/people/')] injectStyle exampleUrl https://coralcap.co/2021/02/when-non-technical-founders-write-code/ last update: 2021-02-10T11:09:05+09:00
-
monogatary.com 2021-02-01T10:11:44+09:00
pageElement //main//article//div[@class='story-section__content'] title //main//article//div[@class='story-header']//h2[@class='story-header__title-sub'] waitSecondInHeadless subtitle //main//article//div[@class='story-header']//h1[@class='story-header__title-name'] nextButton firstPageLink //main//div[@class='write-section__button-box'][1] firstPageButton memo isNeedHeadless true nextLink //section/nav//div[contains(@class,'nav-story__link--next')]/a[contains(@href,'/episode/')] url ^https://monogatary\.com/(story|episode)/\d+ tag author //main//article/div[contains(@class,'popular-user')]//div[@class='popular-user__name']/a[contains(@href,'/user_page/')]/div[contains(@class,'popular-user__name-text')] injectStyle exampleUrl https://monogatary.com/episode/38870 https://monogatary.com/story/33826 last update: 2021-02-01T10:11:44+09:00
-
wattpad 2021-01-26T00:20:40+09:00
title //h3[@class='item-title'] pageElement //div[contains(@class,'panel-reading')]/pre subtitle //header/h1[@class='h2'] firstPageLink //div[@class='story-parts']//ul[@class='table-of-contents']/li/a[contains(@class,'on-navigate-part')] isNeedHeadless true nextLink //a[contains(@class,'next-part')] tag //p[@class='item-tags']/span[@class='tag'] url ^https://www\.wattpad\.com/(story/)?\d+- exampleUrl https://www.wattpad.com/story/115801661-c%C3%B4-g%C3%A1i-tr%C4%83ng-khuy%E1%BA%BFt-m%C6%B0%E1%BB%9Di-hai-cung-ho%C3%A0ng-%C4%91%E1%BA%A1o-full injectStyle .comment-marker.hide-marker { display: none; }; figure { display: none; }; figcaption { display: none; } author //div[contains(@class,'author')]/a[@class='on-navigate' and contains(@href,'/user/')] last update: 2021-01-26T00:31:33+09:00
-
マグミクス 2021-01-24T15:12:00+09:00
title //main//article/h1[@class] pageElement //article//p[@class='post-excerpt']|//article//div[@id='detail-text']/div[@class='paragraph']/*[not(self::figure)] nextLink //article//div[@id='detail-text']/div[@class='nextpage']/a[contains(@href,'/post/')] tag //main//section[@id='article-meta']/div[contains(@class,'article-tags')]/a[@rel='tag' and contains(@href,'/tag/')] url ^https://magmix\.jp/post/\d+ exampleUrl https://magmix.jp/post/45088 https://magmix.jp/post/45256 last update: 2021-01-24T15:17:26+09:00
-
ラジオライフ.com 2021-01-16T22:51:05+09:00
pageElement //div[@id='posts']/div[@class='post']/*[self::h2 or self::p] title //div[@id='posts']/div[@class='post']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://radiolife\.com/[^/]+/[^/]+/\d+/ tag author injectStyle exampleUrl https://radiolife.com/internet/amazon/45201/ last update: 2021-01-16T22:51:05+09:00
-
DeNA エンジニアブログ 2021-01-14T14:17:44+09:00
pageElement //main//div[@class='article-body'] title //main//div[@class='article-header']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://engineer\.dena\.com/posts/ tag //main//div[@class='article-header']//a[contains(@href,'/tags/')] author //div[@class='article-footer']//a[contains(@href,'/authors/')] injectStyle exampleUrl https://engineer.dena.com/posts/2021.01/kencom-hoken-team-building/ last update: 2021-01-14T14:17:44+09:00
-
テレ朝 news 2020-12-18T11:48:48+09:00
pageElement //div[@class='main-container']/section//div[@id='news_body'] title //h1[@id='news_title']/text() waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://news\.tv-asahi\.co\.jp/news_[a-z]+/articles/\d+.html tag author injectStyle exampleUrl https://news.tv-asahi.co.jp/news_society/articles/000201643.html last update: 2020-12-18T11:48:48+09:00
-
Novelism 2020-12-14T23:13:33+09:00
title //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//h1 pageElement //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//div[contains(@class,'v-reader-content-container')] subtitle //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//h2[contains(@class,'v-reader-title')] firstPageLink //*[contains(@class,'table-of-contents')]//li[@id]//a[contains(@href,'/novel/') and contains(@href,'/article/')] isNeedHeadless true nextLink //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//a[contains(@class,'v-reader-pagination-link') and contains(@class,'justify-end')] tag //a[contains(@href,'/keyword/')] url ^https://novelism\.jp/novel/[^/]+/ exampleUrl https://novelism.jp/novel/PZZjgtOjR5aQavm7ruz1kA/ author //div[@id='app']//div[contains(@class,'v-reader')]//div[contains(@class,'v-reader-main')]//div[contains(@class,'avatar')]/span last update: 2021-04-11T13:59:53+09:00
-
好きな物語と出会えるサイト tree 2020-12-06T22:52:41+09:00
pageElement //div[@id='main']//div[@class='episode']/div[@class='inner'] title //div[@id='main']/div[@class='header']//div[@class='title']//a[contains(@href,'/works/')] waitSecondInHeadless subtitle //div[@id='main']//div[@class='episode']/h1 nextButton firstPageLink //div[@class='m-navTab__content']//div[@class='contents']/ol/li/a[contains(@href,'/works/episode/')] firstPageButton memo isNeedHeadless nextLink //div[@id='main']//div[contains(@class,'next')]//p[@class='arrowR']/a[contains(@href,'/works/episode/')] url ^https://tree-novel\.com/works/ tag author //div[@id='side']//div[contains(@class,'title')]/div[contains(@class,'author')]/a[contains(@href,'/author/')] injectStyle exampleUrl https://tree-novel.com/works/691094fcfc4b309954a8121ab4d1eb7a.html last update: 2020-12-06T22:52:41+09:00
-
CyberAgent Developers Blog 2020-11-27T17:30:46+09:00
pageElement //article[@id and contains(@class,'cadev-entry')]/div[@class='entry-content']/*[not(self::figure) and not(self::footer) and not(@class='nav-links')] title //article[@id and contains(@class,'cadev-entry')]/header//h1[@class='entry-title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://developers\.cyberagent\.co\.jp/blog/archives/\d+/ tag //article[@id and contains(@class,'cadev-entry')]/div[@class='entry-content']/footer[@class='entry-footer']/ul[@class='tags']/li/a[@rel='tag'] author //article[@id and contains(@class,'cadev-entry')]/div[@class='entry-content']/footer[@class='entry-footer']//a[contains(@href,'/author/')] injectStyle exampleUrl https://developers.cyberagent.co.jp/blog/archives/27782/ last update: 2020-11-27T17:30:46+09:00
-
SEGA TECH BLOG 2020-11-25T18:13:38+09:00
pageElement //div[@class='entry-content']/*[not(self::figure) and not(child::iframe)] title //h1[@class='entry-title']/a[contains(@href,'/entry/')] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //div[contains(@class,'pager-permalink')]/span[@class='pager-prev']/a[contains(@href,'/entry/') and @rel='prev'] url ^https?://techblog\.sega\.jp/entry/\d+/\d+/\d+/\d+ tag //div[contains(@class,'entry-categories')]/a[contains(@href,'/category/')] author //footer[@class='entry-footer']//span[@class='user-name-nickname'] injectStyle exampleUrl http://techblog.sega.jp/entry/2020/11/25/100000 last update: 2020-11-25T18:13:38+09:00
-
btrax blog 2020-11-25T17:56:35+09:00
title //div[@class='banner']//h1[@itemprop='name'] pageElement //div[@id='wrap']//div[not(@id='in_article_ad')]/div[contains(@class,'wp-content-tag')]/*[not(self::blockquote) and not(contains(@class,'wrap_iframe'))] url ^https://blog\.btrax\.com/jp/[^/]+/ exampleUrl https://blog.btrax.com/jp/google-vs-apple/ author //div[@class='inbox-author']//div[@class='namelog']/a[contains(@href,'/author/')] last update: 2020-11-25T17:57:27+09:00
-
BUSINESS INSIDER 2020-11-11T17:42:39+09:00
pageElement //article[@class='p-post']//div[@class='p-post-content']/div/*[not(contains(@class,'contentFigure')) and not(self::style) and not(@class='ogp')] title //article[@class='p-post']/h1[@class='p-post-title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.businessinsider\.jp/post- tag //div[@class='p-post-tag']/ul[@class='p-post-tagList']/li[@class='p-post-tagItem']/a author //article[@class='p-post']/div[@class='p-post-byline']//li/a[contains(@href,'/author/')] injectStyle exampleUrl https://www.businessinsider.jp/post-223942 last update: 2020-11-11T17:42:39+09:00
-
朝日新聞 EduA 2020-11-08T21:16:42+09:00
pageElement //article//div[contains(@class,'article-detail__body-inner')]/p title //article[@class='article-detail']//h1[contains(@class,'article-detail__caption')] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //nav[@class='pager']/p[contains(@class,'pager__next')]/a url ^https://www\.asahi\.com/edua/article/[0-9]+ tag //article[@class='article-detail']//div[contains(@class,'article-detail__head-row')]/ul[@class='article-detail__tag-list']/li/a[contains(@href,'/edua/tag/')] author //article[@class='article-detail']//div[@class='article-detail__author']/a[contains(@href,'/edua/author/')]//figcaption injectStyle exampleUrl https://www.asahi.com/edua/article/13899713?iref=pc_ss_date last update: 2020-11-08T21:16:42+09:00
-
Berry's Cafe(スマートフォン) 2020-10-28T01:11:51+09:00
title //div[@id='wrapper']/div[@id='content']/div[@id='content-header']/h2 pageElement //div[@id='content']//div[contains(@class,'content-body')] subtitle //div[@id='wrapper']/div[@id='content']/div[@id='content-header']/p[@class='chapter'] firstPageLink //div[@id='content']//dl[@class='chapterLink']//a[contains(@href,'/book/')]|//div[@id='contents-block']/ul/li/a[contains(@href,'/book/') and contains(@href,'/1/')] nextLink //div[@id='wrapper']/div[@id='content']//ul[contains(@class,'pageLink')]/li[@class='pageLinkR']/a[contains(@href,'/book/')] tag //div[@id='content-footer']//ul/li/a[contains(@href,'/search/search.htm') and contains(@href,'word=')] url ^https://www\.berrys-cafe\.jp/spn/book/[^/]+/ exampleUrl https://www.berrys-cafe.jp/spn/book/n1618206/ author //div[@id='content-header']//div[@class='bookDetail']//span[@itemprop='author']/a[contains(@href,'/reader/profile.htm')] last update: 2020-10-28T02:47:37+09:00
-
Berry's Cafe(PC) 2020-10-28T00:30:41+09:00
title //div[@id='header']/h1[@id='top'] pageElement //div[@id='content']/p[contains(@class,'bodyText') and not(contains(@class,'alignC'))] subtitle //div[@id='header']/h3[contains(@class,'sectionTit')] firstPageLink //div[@id='contents-block']//li[contains(@class,'firstChild')]/a[contains(@href,'/book/')]|//div[@id='contents-block']/ul/li/a[contains(@href,'/book/') and contains(@href,'/1/')] nextLink //div[@id='book-footer']/p[@class='pager']/a[contains(@class,'next') and contains(@href,'/book/')] tag //dl[@class='bookKeyword']/dd/a[contains(@href,'/search/search.htm')] url ^https://www\.berrys-cafe\.jp/pc/book/[^/]+/ exampleUrl https://www.berrys-cafe.jp/pc/book/n1618206/ author //div[contains(@class,'bookHeader')]/div[contains(@class,'bookDetail')]/h2[@itemprop='author']/a[contains(@href,'/reader/profile.htm')] last update: 2020-10-28T02:54:08+09:00
-
アニメハック/ニュース 2020-10-27T03:51:32+09:00
pageElement //div[contains(@class,'newsDetailBox')]/*[not(contains(@class,'newsDetailPhotoArea')) and not(contains(@class,'youtubeFrame')) and not(contains(@class,'pageInfoArea'))] title //div[@class='headArea']//h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //div[contains(@class,'pagination')]/span[@class='next_page']/a[@rel='next'] url ^https://anime\.eiga\.com/news/[0-9]+/ tag //div[@class='tagArea']/ul/li/a author injectStyle exampleUrl https://anime.eiga.com/news/112131/ last update: 2020-10-27T03:51:32+09:00
-
Unity for Pro Tips 記事 2020-10-19T16:42:24+09:00
pageElement //div[@class='tips-article-intro']|//div[@class='tips-article-content']/*[not(self::figure) and not(@id='ez-toc-container') and not(self::pre[@class='wp-block-code'])] title //article[@class='tips-article']//h1[@class='tips-article-title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://forpro\.unity3d\.jp/unity_pro_tips/[0-9]+/[0-9]+/[0-9]+/[0-9]+/ tag author injectStyle exampleUrl https://forpro.unity3d.jp/unity_pro_tips/2020/10/06/1313/ last update: 2020-10-19T16:42:24+09:00
-
メシ通 2020-10-18T21:31:18+09:00
pageElement //div[@class='entry-inner']/header/p[@class='entry-og-description']|//div[@class='entry-content']/*[not(@class='profile-cards-list')] title //div[@class='entry-inner']/header/h1[@class='entry-title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.hotpepper\.jp/mesitsu/entry/[^/]+/ tag //div[@class='entry-inner']/header/div[contains(@class,'entry-categories')]/a[contains(@class,'entry-category-link') and contains(@href,'/archive/category/')] author injectStyle exampleUrl https://www.hotpepper.jp/mesitsu/entry/editorial/2020-00345 last update: 2020-10-18T21:31:18+09:00
-
ダ・ヴィンチ ニュース 2020-10-18T18:03:46+09:00
pageElement //div[@class='article-body__main']/*[not(child::figure)] title //article[@class='article-body']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://ddnavi\.com/[^/]+/[0-9]+/[^/]+/ tag //div[contains(@class,'article-block')]/div[@class='article-relatedword']/ul/li/a[contains(@href,'/tag/') and @rel='tag'] author injectStyle exampleUrl https://ddnavi.com/interview/686198/a/ last update: 2020-10-18T18:03:46+09:00
-
CREATORS STATION 2020-10-14T18:55:20+09:00
title //h2[@class='sgl-Title'] pageElement //div[@class='sgl-Content']/*[not(contains(@class,'sgl-Figure')) and not(@class='profile')] tag //div[@class='sgl-Tag']/ul/li/a[@class='sgl-Tag_Link' and contains(@href,'/tag/')] url ^http://www\.creators-station\.jp/[^/]+/([^/]+/)?\d+ exampleUrl http://www.creators-station.jp/interview/curiousity/100370 last update: 2020-10-14T19:05:57+09:00
-
RETRIP 2020-10-10T19:53:37+09:00
pageElement //div[@class='articleMain']//div[@class='content']/p[@class='contentTopDesc']|//div[@class='articleMain']//div[@class='content']/article/*[not(contains(@class,'expImg'))] title //div[@class='contentTopTitle']/h1/a[contains(@href,'/articles/') and @title] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //div[@class='paginateWrap']//a[@rel='next' and contains(@href,'?page=') and @class='next'] url ^https://rtrp\.jp/articles/[0-9]+/ tag //div[contains(@class,'tagBottom')]/ul[@article-tag-calc]//a[contains(@href,'/tags/')] author //div[@class='userProfile']//span[@class='userName']/a[@class='userName' and contains(@href,'/users/')] injectStyle exampleUrl https://rtrp.jp/articles/129003/ last update: 2020-10-10T19:53:37+09:00
-
声優グランプリ 2020-10-09T20:12:51+09:00
pageElement //div[@class='entry-content']/*[not(child::iframe) and not(contains(@class,'twitter-tweet')) and not(class='yarpp-related')] title //div[@class='header-thumbnail-title']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://seigura\.com/\?p= tag //div[@class='entry-header-container']//ul[@class='post-tags']/li/a[contains(@href,'/tag/') and @rel='tag'] author injectStyle exampleUrl https://seigura.com/?p=46753&preview=1&_ppp=dc4c7bce9e last update: 2020-10-09T20:12:51+09:00
-
Yahoo! ニュース(article) 2020-10-07T16:03:02+09:00
pageElement //div[contains(@class,'article_body')]/div/*[not(descendant::picture)] title //article/header/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink //div[@class='pagination_body']//li[contains(@class,'pagination_item-next')]/a[contains(@href,'/articles/') and contains(@data-ylk,'next')] url ^https://news\.yahoo\.co\.jp/articles/ tag author injectStyle exampleUrl https://news.yahoo.co.jp/articles/0960757c17deda48910c476937ed4ceb5afde8a5 last update: 2020-10-07T16:03:02+09:00
-
毎日が発見ネット 2020-10-06T17:26:06+09:00
pageElement //div[@class='entryBody']/*[not(descendant::a[contains(@href,'/cms/mt-search.cgi') and @target='_blank']) and not(self::script)] title //article[@id]/div[@class='asset-header']/h1[@itemprop='name'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://mainichigahakken\.net/[^/]+/article/post- tag //div[@class='wrap-PageInnerTag']/ul[@class='tag-list']/li/a[contains(@href,'/cms/mt-search.cgi') and contains(@href,'tag=')] author injectStyle exampleUrl https://mainichigahakken.net/future/article/post-731.php last update: 2020-10-06T17:26:06+09:00
-
ForRide 2020-10-06T16:43:39+09:00
pageElement //section[@class='entry-content']/*[not(self::section) and not(child::*[@class='youtube']) and not(@id='ez-toc-container') and not(child::img) and not(@class='shopinfo')] title //header[@class='post-header']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://forride\.jp/[^/]+/ tag //section[@class='tab']//div[contains(@class,'keyword')]/ul/li/a[contains(@href,'/tag/') and @rel='tag'] author //section[@class='author']/div[@class='description']/h3 injectStyle exampleUrl https://forride.jp/motorcycle/noslisu last update: 2020-10-06T16:43:39+09:00
-
PIXIV FANBOX 2020-10-06T15:40:49+09:00
pageElement //div[@class='DraftEditor-root'] title //title waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://[^./]+\.fanbox.cc/posts/ tag //div[preceding-sibling::article]/a[contains(@href,'/tags/')] author //a[@href='/plans']/button/div/span/div injectStyle exampleUrl https://akzw.fanbox.cc/posts/1471939 last update: 2020-10-06T15:40:49+09:00
-
Buzz Plus News 2020-10-06T12:53:10+09:00
pageElement //div[@id='sentences']/*[not(descendant::img) and not(@class='ad-desktop-w') and not(contains(@class,'youtube')) and not(@class='info-buzzplus')] title //div[@id='article-title']/h1 waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://buzz-plus\.com/article/[0-9]+/[0-9]+/[0-9]+/ tag //div[contains(@class,'post-tag-list')]/a[contains(@href,'/buzz-plus.com/tag/') and @rel='tag'] author //div[@class='writer-info']//a[contains(@href,'/author/')] injectStyle exampleUrl https://buzz-plus.com/article/2020/10/05/alien5-start-again-news/ last update: 2020-10-06T12:53:10+09:00
-
Amebaブログ 2020-10-05T14:56:49+09:00
pageElement //div[@id='entryBody'] title //h1[@class='skin-entryTitle'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://ameblo\.jp/[^/]+/entry-[0-9]+\.html tag //dd/a[contains(@href,'/theme-') and @rel='tag'] author //div[contains(@class,'skin-profile')]//a[contains(@href,'profile.ameba.jp')] injectStyle exampleUrl https://ameblo.jp/yoshiko-sakakibara/entry-12629209284.html last update: 2020-10-05T14:56:49+09:00
-
zenn 2020-09-27T20:30:39+09:00
title //h1[contains(@class,'ArticleHeader_title')] pageElement //section//div[contains(@id,'toc-target-content')]/div/*[not(self::div[@class='code-block-container'])] tag //a[contains(@class,'TopicList_item') and contains(@href,'/topics/')]/div[contains(@class,'TopicList_name')] url ^https://zenn\.dev/[^/]+/articles/ exampleUrl https://zenn.dev/ymrl/articles/ec72de6f18fe04a28127 https://zenn.dev/qnighy/articles/64145f6ff849e5 author //aside[contains(@class,'ArticleMain_author')]//a[contains(@class,'UserBio_name')] last update: 2021-01-02T16:45:21+09:00
-
和楽 2020-09-27T07:33:38+09:00
title //div[contains(@class,'article-header-area')]/h1 pageElement //div[@class='article-content']/*[not(self::figcaption) and not(self::div[@itemprop='author']) and not(self::div[@class='sns-share-box'])] tag //div[contains(@class,'article-header-area')]//div[@class='article-author']/a/div[contains(@class,'category')] url ^https://intojapanwaraku\.com/[^/]+/\d+/ exampleUrl https://intojapanwaraku.com/travel/122476/ author //div[contains(@class,'authorname')]/a[contains(@href,'https://intojapanwaraku.com/author/')]/span[@itemprop='name'] last update: 2020-09-27T07:45:08+09:00
-
大紀元 EPOCH TIMES 2020-09-27T07:22:09+09:00
pageElement //article/div[@class='page_content'] title //h1[@class='page_title'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.epochtimes\.jp/p/ tag author injectStyle exampleUrl https://www.epochtimes.jp/p/2020/09/62683.html last update: 2020-09-27T07:22:09+09:00
-
中日新聞 2020-09-26T19:24:23+09:00
pageElement //div[@class='content-area']//div[@class='block' and not(child::div[@class='clear'])] title //main//h1[@class='hdg'] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.chunichi\.co\.jp/article/ tag author injectStyle exampleUrl https://www.chunichi.co.jp/article/127041 last update: 2020-09-26T19:24:23+09:00
-
NATIONAL GEOGRAPHIC 2020-09-23T19:29:23+09:00
title //div[@class='articleTitleBox']/h1 pageElement //div[@class='articleInner']/*[not(@class='topPageNav') and not(@class='bpbox_center') and not(@class='recommendBox') and not(@class='btmPageNav') and not(@class='bpimage_right')] firstPageLink //div[@id='authorKijiList']//ul/li/p[@class='title']/a memo 連載記事と単発の記事があるので注意 nextLink //div[@class='pageNav']//a[@class='nextPage']|//div[@id='pagePrevNextNaviBottom']/a[@class='next'] url ^https://natgeo\.nikkeibp\.co\.jp/[^/]+/[^/]+/ exampleUrl https://natgeo.nikkeibp.co.jp/nng/article/20140623/403966/ https://natgeo.nikkeibp.co.jp/atcl/news/17/062700244/ last update: 2020-09-23T19:31:58+09:00
-
ソレドコ 2020-09-18T15:10:16+09:00
title //h1[contains(@class,'entry-title')]/a[contains(@href,'/entry/')] pageElement //div[@class='entry-content']/*[not(child::img) and not(self::footer) and not(child::a[@target='_blank'])] tag //div[contains(@class,'entry-categories')]/a[contains(@href,'/archive/category/')] url ^https://srdk\.rakuten\.jp/entry/ exampleUrl https://srdk.rakuten.jp/entry/2020/09/18/103000 last update: 2021-04-07T13:23:49+09:00
-
Bloomberg jp news article 2020-09-18T14:06:26+09:00
pageElement //div[contains(@class,'body-columns')]/div[contains(@class,'body-copy')]/*[not(child::a[contains(@href,'/join/')])] title //h1[contains(@class,'lede-text-only__hed')] waitSecondInHeadless subtitle nextButton firstPageLink firstPageButton memo isNeedHeadless nextLink url ^https://www\.bloomberg\.co\.jp/news/articles/ tag author //address injectStyle exampleUrl https://www.bloomberg.co.jp/news/articles/2020-09-17/QGTJFFT1UM1301 last update: 2020-09-18T14:06:26+09:00