title | //div[contains(@class,'article-contents')]/h1 |
---|---|
exampleUrl | http://www.risktaisaku.com/articles/-/7968 |
url | http://www.risktaisaku.com/articles/-/ |
author | |
tag | //ul[contains(@class,'tags')]/li/a |
pageElement | //div[contains(@class,'main')]/div[contains(@class,'article-body')]/*[not(self::div[@id='login'])] |
subtitle | //div[contains(@class,'article-contents')]/h2 |
firstPageLink | |
nextLink | //a[child::div[@id='next-page']] |
memo |
Database: ことせかいWebページ読み込み用情報
ことせかい という読み上げアプリで利用するデータです。
Webで読める小説を取り込むために、文書の場所や次のページへのlinkなどをさすxpathを記述します。
幾つかの項目はAutopagerizeとほぼ同じ意味です。
ことせかい については以下のURLを参照してください。
http://limura.github.io/NovelSpeaker/
以下、個々の属性についての概ねの方針を書いておきます。
url
対象のURLしてヒットする正規表現を書きます。
pageElement
読み上げ対象となる文字列が含まれるエレメントを取り出すxpathを書きます。複数hitするようなxpathを書いた場合、その全てが取り出されます。
nextLink
次のページに続く場合のaタグを指定するxpathを書きます。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
Autopagerize側では必須属性になっていますが、こちらでは必須ではありません。つまり、Autopagerizeは(その目的から)1ページに全てが入っているサイトは登録されていませんので、そのようなサイトはこちらに登録する必要があります。また、Autopagerize側で主題が違う記事へのnextLinkが指定されているものについて、こちら側のデータベースにnextLinkが無い状態で登録することによって、主題が違う記事を読み込まないようにする事もできなくもありません。
title
本棚に登録される時の名前として採用される文字列を含むエレメントを取り出すためのxpathを書きます。
subtitle
(2017/12/18: 将来的に利用するための項目です)小説の個々の章にあたるサブタイトルを抽出できるエレメントを取り出すためのxpathを書きます。
author
作者名として採用される文字列を含むエレメントを指定するxpathを書きます。
firstPageLink
小説のタイトルページ(本文は含まない)がある場合、そのタイトルページから本文のページに遷移するためのaタグを指定します。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
注意:firstPageLink にヒットした場合、そのURLを読み直して評価をし直すため、無限に firstPageLink の読み込み先を読んで場合があります。そのようにならないように firstPageLink の xpath を指定してください。
tag
その小説等に関する文字列タグが列挙されているエレメントがある場合は指定します。将来的に小説の検索などに使われるタグとして利用されるつもりのものになります。幾つかターゲットを書いてみたところ、どうやら Aレコード でタグへのlinkになっているものが多いようで、その場合は内部にスペースがあるタグなども見受けられましたため、Aレコードのようなエレメント毎に一つのタグとして取り込めないかな?と思っています。ということでできればAレコードそのものを取り出すように(a/text() のような XPath を書いてテキストだけにしないように)して頂ければ幸いです。
isNeedHeadless
JavaScriptが動作した後に本文部分(pageElement)が生成される場合には何らかの値("true"が推奨)を入れます。"false" や "False", "nil", "0", ""(何も入れない) の場合には単にGETリクエストで取得された値について評価して良いという意味になります。
nextButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を次へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、nextLink よりも nextButton の方が先に評価されます(nextButton と nextLink が両方共に存在する場合は nextButton が優先されます)。
firstPageButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を最初の本文へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、firstPageLink よりも firstPageButton の方が先に評価されます(firstPageButton と firstPageLink が両方共に存在する場合は firstPageButton が優先されます)。
forceClickButton
(実験的機能なので将来的に変更される可能性があります)isNeedHeadless が有効になっている場合、ここで指定される要素が存在した場合はその要素に対して .click() が実行された後、改めて内容を評価し直します。特定のボタンを押さないと先に進めない場合などに利用します。
waitSecondInHeadless
isNeedHeadless が有効になっている場合、ページが読み込まれたと思われる後、さらにここで指定される数値で指定される秒数待った後にinnerHTMLを評価します。
injectStyle
pageElement で取り出した後のHTMLに対して強制的に適用するstyleを記述します。これは、pageElementで取り出した後のHTMLにはstyleが適用されない(パスが違うのでstyleが適用されないであるとか、pageElementで取り出されたHTMLにはstyleが無いであるとか、styleは別のファイルになっているのでGETリクエスト一回では取り出せないであるといったときに、white-space:pre-wrap; で指定されるようなコンテンツが入っているとHTMLからStringに変換した時に改行周りとかが省略されてしまって悲しいことになるという問題を回避するための物になります。(例えば、pageElement として <div class="content xxx yyy">...</div> が取り出されるのがわかっている場合、"div.content{white-space:pre-wrap;}" といったような値を指定する事を期待しています。
exampleUrl
対象のURLを書きます。後で動作確認などをする時に利用します。複数書く場合は半角スペースで区切ってください。
memo
何らかのメモ書きを残すべきと思った場合は書いておいてください。日本語でOKです。
また、次のページや最初のページを判定するための要素がいくつかあるのでそれらの優先順位を別途書き記しておきます。
優先される順序は
1. forceClickButton
2. nextButton
3. firstPageButton
4. nextLink
5. firstPageLink
の順(数字が若い方が優先)になります。
なお、ことせかい の動作としては、このデータベースとAutopagerizeのデータベースの両方を使ってデータを読み込むように作られています。
動作としては対象のURLについて、まずこちらのデータベースにあるものが優先され、こちらのデータベースに載っていないURLのものについてはAutopagerizeのデータベースを参照することになります。
ですので、Autopagerize側で定義されている情報で十分なものの場合は改めてこちら側のデータベースに登録する必要は無いかもしれません。
Last Update: 2024-04-16T12:03:19+09:00 History
Item List
-
リスク対策.com 2018-07-27T01:11:41+09:00
last update: 2018-07-27T01:11:41+09:00
-
CGWORLD.JP 2018-07-26T17:29:14+09:00
title //div[contains(@class,'article-category')]/h2[contains(@class,'box-headline')]/text() exampleUrl https://cgworld.jp/regular/201807-asobi-05-3.html https://cgworld.jp/interview/201807-modecafe-photon.html url ^https?://cgworld\.jp/[^/]*/ author //div[contains(@class,'article-body')]/ul[contains(@class,'list01') and preceding-sibling::h2[contains(text(),'プロフィール')]]/li/span tag pageElement //div[contains(@class,'article-body')]/*[not(preceding-sibling::h2[contains(text(),'プロフィール')]) and not(self::h2[contains(text(),'プロフィール')]) and not(self::p/a/span[contains(text(),'次ページ')])] subtitle //header[contains(@class,'article-header')]/h1[contains(@class,'article-header-hdg')] firstPageLink nextLink //a[contains(@class,'pageNav-btnNext')] memo last update: 2018-07-26T17:29:14+09:00
-
Dybe! 2018-07-26T15:24:08+09:00
title //h1[contains(@class,'post-title')] exampleUrl https://ten-navi.com/dybe/1014/ url ^https?://ten-navi\.com/dybe/[^/]*/ author //div[contains(@class,'writer')]/div[contains(@class,'txt')]/p/strong tag //ul[contains(@class,'tag-list')]/li/a pageElement //div[contains(@class,'post-content')]/*[not(self::h2[contains(@class,'writer-hdg')]) and not(self::div[contains(@class,'writer')])] subtitle firstPageLink nextLink memo last update: 2018-07-26T15:24:08+09:00
-
P2Pとかその辺のお話R 2018-07-26T05:02:29+09:00
title //h1[contains(@class,'entry-title')] pageElement //article[@id]//div[contains(@class,'entry-content')] tag //div[@class='entry-categories']/span/a[contains(@href,'/category/')] url ^https://p2ptk\.org/[^/]*/ exampleUrl https://p2ptk.org/freedom-of-speech/1095 author //a[contains(@class,'author') and contains(@href,'/author/')] last update: 2021-02-25T21:44:05+09:00
-
IIJ Engineers Blog 2018-07-26T02:15:16+09:00
title //h2[contains(@class,'entry-title')] exampleUrl http://eng-blog.iij.ad.jp/archives/1896 url ^https?://eng-blog\.iij\.ad\.jp/archives/[0-9]* author //div[contains(@class,'article-author-data')]/strong tag pageElement //div[contains(@class,'article')]/*[not(self::div[contains(@class,'article-author')])] subtitle firstPageLink nextLink memo last update: 2018-07-26T02:15:16+09:00
-
電撃Online 2018-07-26T01:24:53+09:00
title //div[@id='newsHead']/h1 exampleUrl http://dengekionline.com/elem/000/001/768/1768305/ url ^https?://dengekionline\.com/elem/[0-9]*/[0-9]*/[0-9]*/[0-9]*/ author //p[@id='authorName']/a tag pageElement //div[@id='contArt']/*[not(@id='articleBannerBottom') and not(self::script) and not(self::div[contains(@class,'social_large cf') or contains(@class,'data_box') or contains(@class,'ajarecommend2') or contains(@class,'banner')]) and not(self::ul[contains(@class,'ofclLink') or contains(@class,'related')]) and not(self::p[contains(@class,'data_title') or contains(@class,'relatedtitle')])] subtitle firstPageLink nextLink memo last update: 2018-07-26T01:24:53+09:00
-
Lifehacker 2018-07-25T18:14:34+09:00
title //h1[contains(@class,'article_pArticle_Title')] pageElement //div[contains(@class,'articleBodyWrapper')]/div[contains(@class,'postContent')]/*[not(self::figure) and not(@class='embedblock')] tag //div[contains(@class,'article_pArticle_Head')]//a[contains(@href,'/category/') and contains(@class,'category')] url ^https?://www\.lifehacker\.jp/article/[^/]+/ exampleUrl https://www.lifehacker.jp/2018/07/171858_basepasta.html author //p[contains(@class,'article_pArticle_Credit')]//span[contains(@class,'article_pArticle_CreditName') and not(preceding-sibling::span[contains(@class,'article_pArticle_CreditName')])] last update: 2022-04-05T20:23:45+09:00
-
GOZILINE 2018-07-25T18:07:42+09:00
title //article//h1[contains(@class,'entry-title')] exampleUrl https://goziline.com/archives/24479 url ^https?://goziline\.com/archives/ author tag //p[contains(@class,'tagst')]//a[contains(@rel,'category') and contains(@rel,'tag')] pageElement //article/div[contains(@class,'category-article')]/*[not(self::div[@id='breadcrumb']) and not(self::div[contains(@class,'blogbox')]) and not(self::div[contains(@class,'jp-relatedposts')]) and not(self::div[contains(@class,'sharedaddy')]) and not(self::div[contains(@class,'ts-fab-wrapper')]) and not(self::p[contains(@class,'extend_page_break')]) and not(self::p[contains(@class,'tagst')]) and not(self::h1[contains(@class,'entry-title')]) and not(self::aside)] subtitle firstPageLink nextLink (//link|//a)[contains(concat(' ', translate(normalize-space(@rel),'NEXT','next'), ' '), ' next ')] memo last update: 2018-07-25T18:07:42+09:00
-
ASCII.jp 2018-07-22T19:32:08+09:00
title //div[@id='articleHead']//h1 exampleUrl http://ascii.jp/elem/000/000/143/143379/ author //p[contains(@class,'author')] url ^https?://(?:www\.|tech\.)?ascii\.jp/elem/(?:[^/]+/){4} pageElement //div[@id='mainC']/*[not(self::div[@id='articleHead']) and not(self::p[contains(@class,'twitBtn')]) and not(self::script) and not(self::p[contains(@class,'returnCat')]) and not(self::div[@id='artAds' or @id='clubreco']) and not(self::div[contains(@id,'popIn_recommend')]) and not(self::h5[contains(@class,'serial') or contains(@class,'related')]) and not(self::ul[contains(@class,'artsCont')])] nextLink //a[@class="next" or parent::span[@class="next"] or contains(text(), "(続きはこちら)") or img/@src="/img/bt_comicnex.gif"]|//span[@class="next" and last()]/a[contains(text(),"次へ")]|//ul[@class="pager"]/li/a[contains(text(), "次へ")] last update: 2018-07-22T19:33:37+09:00
-
京都新聞 2018-07-22T03:12:54+09:00
title //div[@id='mainHeading']/h1 exampleUrl http://www.kyoto-np.co.jp/politics/article/20180721000123 url ^https?://www\.kyoto-np\.co\.jp/[^/]*/article/ author tag pageElement //div[@id='news']/p[not(contains(@class,'timeStamp'))] subtitle firstPageLink nextLink memo last update: 2018-07-22T03:12:54+09:00
-
academist 2018-07-22T02:17:50+09:00
title //div[@id='wrapper3']//center/h2 exampleUrl https://academist-cf.com/projects/72 url ^https?://academist-cf\.com/projects/ author //aside[contains(@class,'profile')]/div[contains(@class,'txt')]/h2 tag pageElement //div[@id='tab1'] subtitle firstPageLink nextLink memo last update: 2018-07-22T02:17:50+09:00
-
SPOT NOTE 2018-07-22T01:48:23+09:00
title //h1[contains(@class,'entry-title')] exampleUrl https://spotnote.jp/ap-bank-fes-2018-1st-day/ tag //div[contains(@class,'meta-tag')]//ul/li/a|//ul[contains(@class,'post-categories')]/li/a url ^https?://[^/]*\.?spotnote\.jp/ pageElement //section[contains(@class,'entry-content')]/*[not(self::div[@id='toc_container']) and not(self::div[contains(@class,'amazlet-box')]) and not(noscript) and not(*/noscript)] last update: 2018-07-22T01:56:29+09:00
-
TASCLAP 2018-07-22T00:45:17+09:00
title //h1[contains(@class,'main-title')] exampleUrl https://mens.tasclap.jp/a3669 url ^https?://[^.]*.tasclap.jp/ author //p[contains(@class,'main-editor')]/a tag pageElement //div[contains(@class,'content-wrap')] subtitle //p[contains(@class,'main-description')] firstPageLink nextLink memo last update: 2018-07-22T00:45:17+09:00
-
INDIE GAMES THE WEBLOG 2018-07-22T00:10:31+09:00
title //div[contains(@class,'post')]/h1 exampleUrl http://indiegames.com/2018/07/the_binding_of_isaac_four_soul.html url ^https?://indiegames\.com/[^/]*/[^/]*/ author //div[contains(@class,'post')]/p[contains(@class,'posted')]/a tag //div[contains(@class,'postMeta')]//p[contains(@class,'tags')]/a pageElement //div[contains(@class,'postContent')] subtitle firstPageLink nextLink memo last update: 2018-07-22T00:10:31+09:00
-
BBC NEWS 2018-07-21T23:09:20+09:00
title //h1[contains(@class,'story-body__h1')] exampleUrl https://www.bbc.com/news/world-asia-44910435 url ^https?://www\.bbc\.com/[^/]*/ author tag //ul[contains(@class,'tags-list')]/li[contains(@class,'tags-list__tags')]/a pageElement //div[contains(@property,'articleBody')] subtitle firstPageLink nextLink memo last update: 2018-07-21T23:09:20+09:00
-
TechCrunch 2018-07-21T23:03:18+09:00
title //h1[contains(@class,'tweet-title')] exampleUrl https://jp.techcrunch.com/2018/07/21/2018-07-20-now-this-this-is-an-ultra-wide-monitor/ url ^https?://jp\.techcrunch\.com/[0-9]*/[0-9]*/[0-9]*/ author //div[contains(@class,'byline')]/a tag pageElement //div[contains(@class,'article-entry')]/*[not(self::style) and not(self::script) and not(self::div[@id='social-after-wrapper']) and not(self::div[contains(@class,'social-flw')])] subtitle firstPageLink nextLink memo last update: 2018-07-21T23:03:18+09:00
-
FOOCOM.net 2018-07-21T22:56:15+09:00
title //section[@class='contents']/h1 pageElement //section[@class='contents']/*[self::p or self::h3] tag //section[@class='contents']/h2[@class='keywords']/a[contains(@href,'/tag/')] url ^https://foocom\.net/[^/]+/[^/]+/\d+/ exampleUrl http://www.foocom.net/column/answer/17106/ author //article[@class='author-below']//h2 last update: 2021-12-22T14:09:22+09:00
-
TOM blog 2018-07-21T22:43:52+09:00
title //h1[contains(@class,'article-title')] exampleUrl http://blog.otakumode.com/2018/07/20/v-tuber-summit-1/ url ^https?://blog\.otakumode\.com/[0-9]*/[0-9]*/[0-9]*/[^/]*/ pageElement //div[contains(@class,'entry-content')]/*[not(self::iframe) and not(self::script) and not(contains(@class,'social-button-list'))] last update: 2018-07-21T22:56:51+09:00
-
シネマトゥデイ 2018-07-21T22:25:06+09:00
title //article[contains(@class,'text')]/header/h1 exampleUrl https://www.cinematoday.jp/news/N0102365 url ^https?://www\.cinematoday\.jp/[^/]*/ author tag pageElement //article[contains(@class,'text')]/p subtitle firstPageLink nextLink memo last update: 2018-07-21T22:25:06+09:00
-
cakes 2018-07-21T22:06:37+09:00
title //h1[contains(@class,'article-title')] pageElement //div[@id='area_article_main']/div[contains(@class,'article-content')]|//div[@id='area_article_main']/div[contains(@class,'article-lead')] nextLink //div[@class='box-pagenation-top']//a[@data-ga='post:header:next' and contains(@href,'/posts/')] tag //ul[contains(@class,'meta-list')]/li/a url ^https?://cakes\.mu/posts/[0-9] exampleUrl https://cakes.mu/posts/21681 author //p[contains(@class,'post-author')] last update: 2021-01-23T21:33:34+09:00
-
はてなブックマーク 2018-07-21T19:26:40+09:00
title //h1[contains(@class,'entry-info-title')] exampleUrl http://b.hatena.ne.jp/entry/s/www3.nhk.or.jp/news/html/20180720/k10011540761000.html tag //span[contains(@class,'entry-info-category')]/a|//ul[contains(@class,'entry-tags')]/li/a|//ul[contains(@class,'entry-comment-tags')]/li/a author //span[contains(@class,'entry-info-domain')]/a url ^https?://b\.hatena\.ne\.jp/entry/ pageElement //span[contains(@class,'entry-comment-text')]|//span[contains(@class,'entry-comment-username')] last update: 2018-07-22T14:18:37+09:00
-
@IT 2018-07-21T19:16:56+09:00
title //div[contains(@id,'cmsTitle')]//h1 exampleUrl http://www.atmarkit.co.jp/ait/articles/1806/01/news040.html author //div[contains(@id,'cmsByline')]/div[contains(@id,'byline')]/a url ^https?://[^.]*\.atmarkit\.co\.jp/[^/]*/articles/[^/]*/[^/]*/ subtitle //div[contains(@id,'cmsAbstract')]//h2 pageElement //div[contains(@id,'cmsBody')]/div[contains(@class,'inner')]/*[not(self::script) and not(self::div[contains(@id,'masterSocialbuttonTop')]) and not(self::div[contains(@class,'cmsBodyItmidSeriesButtonRegist')]) and not(self::div[contains(@id,'ITIR')]) and not(self::div[contains(@id,'cmsSeriesList')]) and not(self::div[contains(@id,'cx_recommend')]) and not(self::div[contains(@id,'cmsCopyright')]) and not(self::span[contains(@id,'update')])] nextLink //div[contains(@id,'start')]/span[contains(@id,'next')]/a[contains(text(),'次のページへ')] last update: 2018-07-22T02:37:02+09:00
-
カラパイア 2018-07-21T18:31:03+09:00
title //div[contains(@class,'widget-header')]/h1 pageElement //div[@id='article-contents']/*[not(self::script) and not(self::style) and not(self::link) and not(contains(@class,'responsive-img')) and not(contains(@class,'readmore-header')) and not(@id='ad2') and not(@align='right') and not(@id='articlemore-social') and not(text()='あわせて読みたい') and not(self::a[contains(@href,'/archives/') and not(@title)])]|//div[@id='article-contents']/text() tag //div[@id='article-tags']/ul/li/a[contains(@href,'/tag/')] url ^https?://karapaia\.com/archives/ exampleUrl http://karapaia.com/archives/52262608.html last update: 2023-03-03T12:56:48+09:00
-
BBC NEWS JAPAN 2018-07-21T02:13:37+09:00
title //main[@role='main']/div/h1[@id='content'] pageElement //main[@role='main']/*[not(child::h1[@id='content']) and not(child::figure) and not(child::time) and not(self::section[@aria-hidden='true']) and not(child::ul[child::li[child::a[contains(@href,'/japanese/')]]])] url ^https?://www\.bbc\.com/japanese/ exampleUrl https://www.bbc.com/japanese/54869478 https://www.bbc.com/japanese/features-and-analysis-44780348 last update: 2022-11-13T00:46:59+09:00
-
pixiv inside 2018-07-20T22:19:26+09:00
title //h1[contains(@class,'single-inner-title')] exampleUrl https://inside.pixiv.blog/mossann/4480 url ^https?://inside\.pixiv\.blog/[^/]*/ author //div[contains(@class,'single-inner-info-author')] tag //p[contains(@class,'article-list-item-category')]/a pageElement //div[contains(@class,'single-inner-entry-content')] subtitle firstPageLink nextLink memo last update: 2018-07-20T22:19:26+09:00
-
Mogura VR 2018-07-20T01:15:19+09:00
title //main/h1 pageElement //main/article/*[not(contains(@class,'mg-ads-')) and not(contains(@class,'mg-content-card'))] tag //main//aside/a[contains(@href,'/tag/')] url ^https?://www\.moguravr\.com/ exampleUrl https://www.moguravr.com/ivr-vkatsu/ author //main//aside//p/a[contains(@href,'/writer/')] last update: 2022-05-21T11:58:00+09:00
-
アプリマーケティング研究所 2018-07-20T00:20:52+09:00
title //h1[contains(@class,'title')] exampleUrl https://appmarketinglabo.net/lips-marketing/ url ^https?://appmarketinglabo\.net/[^/]*/ author tag pageElement //div[contains(@class,'entry')]/*[not(contains(@class,'wp_social_bookmarking_light'))] subtitle firstPageLink nextLink memo last update: 2018-07-20T00:20:52+09:00
-
Qiita 2018-07-19T19:57:28+09:00
title //h1[contains(@class,'it-Header_title')] pageElement //div[contains(@id,'article-body')] tag //div[contains(@class,'it-Tags')]/a url ^https?://qiita\.com/[^/]*/items/ exampleUrl https://qiita.com/momomopas/items/2fbe394f55b63f45882a author //div[contains(@class,'it-Header_author')]/a[contains(@class,'it-Header_authorName')] last update: 2020-07-15T19:56:29+09:00
-
DIME 2018-07-19T19:40:06+09:00
title //h1[contains(@class,'detailMeta_title')] exampleUrl https://dime.jp/genre/567605/ url ^https?://dime\.jp/ author tag //section[contains(@class,'detailMeta')]//li[contains(@class,'tagList_link')]/a pageElement //div[contains(@class,'entryBody')] subtitle firstPageLink nextLink //li[contains(@class,'pager_list_link-next')]/a memo last update: 2018-07-19T19:40:06+09:00
-
UX MILK 2018-07-19T19:31:47+09:00
title //div[contains(@class,'panel__header')]/text() exampleUrl https://uxmilk.jp/book/66874 https://uxmilk.jp/43956?book=66874 url ^https?://uxmilk\.jp/ author //div[contains(@class,'author__name')] tag //a[contains(@class,'tag')] pageElement //div[contains(@class,'article__body')] subtitle //h1[contains(@class,'article__title')] firstPageLink //div[contains(@class,'article__body')]/div[contains(@class,'feed')]//a[contains(@class,'feed__title')] nextLink //div[contains(@class,'book__pagination')]/div/a memo last update: 2018-07-19T19:31:47+09:00
-
Googleウェブマスター向けブログ 2018-07-19T18:53:39+09:00
title //div[contains(@class,'post')]/h2[contains(@class,'title')] exampleUrl https://webmaster-ja.googleblog.com/2018/07/an-update-to-referral-source-urls-for.html url ^https?://[^.]*.googleblog.com/[0-9]*/[0-9]*/ author //span[contains(@class,'post-author')] tag //span[contains(@class,'labels')]/a pageElement //div[contains(@itemprop,'articleBody')] subtitle firstPageLink nextLink memo last update: 2018-07-19T18:53:39+09:00
-
MANTANWEB 2018-07-19T18:31:39+09:00
title //h1[@class='article__title'] pageElement //div[@class='article_text__wrap'] tag //div[@class='article__tag']/a[contains(@href,'/matome/')] url ^https?://mantan-web\.jp/article/ exampleUrl https://mantan-web.jp/article/20180704dog00m200014000c.html last update: 2021-05-28T20:04:29+09:00
-
BUZZFeeD 2018-07-19T17:50:13+09:00
title //h1[contains(@class,'buzz-title')] exampleUrl https://www.buzzfeed.com/jp/kotahatachi/summer-gus author //div[contains(@class,'buzz-byline')]//div[contains(@class,'byline__title')] url ^https?://www\.buzzfeed\.com/jp/[^/]*/ subtitle //header[contains(@class,'buzz-header')]//p[contains(@class,'buzz-dek')] pageElement //node()[contains(@class,'subbuzz__description') or contains(@class,'subbuzz__title-text') or contains(@class,'subbuzz-text')] last update: 2018-10-16T17:43:07+09:00
-
NEW'S VISION 2018-07-19T16:09:21+09:00
title //ul[contains(@id,'article_ttl')]//h1 exampleUrl https://news-vision.jp/article/188599/ url ^https?://news-vision\.jp/(intro|article)/[0-9]*/ author //div[contains(@class,'list_author_name')]/text() tag //div[contains(@class,'page_tags')]/a pageElement //div[contains(@class,'article-body')]/node()[not(contains(@class,'sns-follow-btn')) and not(contains(@class,'sns_bar_w')) and not(contains(@class,'sp_wbox')) and not(contains(@id,'postpage')) and not(contains(@class,'btn_next')) and not(script)] subtitle firstPageLink //a[contains(@id,'ev-read-article')] nextLink //a[contains(@class,'btn_next')] memo last update: 2018-07-19T16:09:21+09:00
-
livedoor NEWS 2018-07-19T04:09:30+09:00
title //h1[contains(@class,'articleTtl')] exampleUrl http://news.livedoor.com/article/detail/15030274/ url ^https?://news\.livedoor\.com/article/ author //div[contains(@class,'articleMeta')]/p[contains(@class,'articleVender')]//span[contains(@itemprop,'author')] tag //ul[contains(@class,'articleHeadKeyword')]/li/a pageElement //div[contains(@class,'articleBody')] subtitle firstPageLink nextLink memo last update: 2018-07-19T04:09:30+09:00
-
FC2 blog(北森瓦版) 2018-07-19T03:51:07+09:00
title //div[contains(@class,'mainEntryTitle')]/h2 exampleUrl https://northwood.blog.fc2.com/blog-entry-9438.html url ^https?://[^.]*\.blog\.fc2\.com/blog-entry- pageElement //div[contains(@class,'mainEntryBody')]|//div[contains(@class,'mainEntryMore')]/node()[not(contains(@class,'fc2_footer'))] last update: 2018-07-19T03:52:39+09:00
-
TBS NEWS 2018-07-19T03:35:41+09:00
title //div[@class='cp-article']//div[@class='ls-title'] pageElement //div[@class='ls-body'] url ^https?://news\.tbs\.co\.jp/newseye/ exampleUrl http://news.tbs.co.jp/newseye/tbs_newseye6011149.html last update: 2022-04-03T20:35:05+09:00
-
PublicKey 2018-07-19T03:23:09+09:00
title //div[contains(@id,'maincol')]/h1 exampleUrl https://www.publickey1.jp/blog/18/aivisual_studio_intellicode.html url ^https?://www\.publickey.\.jp/blog/[0-9]*/ author tag pageElement //div[contains(@id,'maincol')]/node()[not(contains(@class,'pubdate')) and not(contains(@id,'breadcrumbs')) and not(contains(@class,'sbm'))] subtitle firstPageLink nextLink memo last update: 2018-07-19T03:23:09+09:00
-
Yahoo! ニュース 2018-07-19T03:15:47+09:00
title //div[contains(@class,'articleBody')]/div[contains(@class,'hd')]/h1 exampleUrl https://news.yahoo.co.jp/byline/tokurikimotohiko/20180718-00089854/ author //div[contains(@class,'articleInfo')]//span[contains(@class,'name')] url ^https?://news\.yahoo\.co\.jp/byline/[^/]*/[0-9]*-[0-9]*/ pageElement //div[contains(@class,'articleBody')]/div[contains(@class,'bd')]/*[not(contains(@id,'socialBtn'))] last update: 2018-07-27T17:02:13+09:00
-
KASPERSKY Lab blog 2018-07-19T02:53:32+09:00
title //h1[contains(@itemprop,'name')] exampleUrl https://blog.kaspersky.co.jp/spam-phishing-description/20780/ url ^https://blog\.kaspersky\.co\.jp/[^/]*/[^/]*/ author //div[contains(@class,'author-info')]//span[contains(@itemprop,'name')] tag //div[contains(@class,'entry-tags')]/ul/li/a pageElement //div[contains(@itemprop,'articleBody')] subtitle firstPageLink nextLink memo last update: 2018-07-19T02:53:32+09:00
-
InfoQ 2018-07-19T01:42:47+09:00
title //div[contains(@class,'heading__container')]//h1[@class='heading'] pageElement //div[@class='article__data'] tag //div[contains(@class,'topics')]//ul[contains(@class,'topics')]//a[contains(@class,'related__topic')] url ^https?://www\.infoq\.com/jp/news/ exampleUrl https://www.infoq.com/jp/news/2018/07/thanos-scalable-prometheus author //ul[contains(@class,'authors')]//p[contains(@class,'author__bio')]/span[@class='author__name'] last update: 2020-09-30T22:25:48+09:00
-
HUFFPOST 2018-07-19T01:27:05+09:00
title //h1[contains(@class,'headline')] pageElement //section[contains(@class,'js-entry-content')]/*[not(self::figure) and not(contains(@class,'advertisement')) and not(self::aside)] subtitle //header/div[contains(@class,'dek')] tag //section[contains(@class,'entry__tags')]/a url ^https?://www\.huffingtonpost\.jp/[^/]+/ exampleUrl https://www.huffingtonpost.jp/2018/07/17/school-ac_a_23483652/ author //section[@id='entry-footer']//h2[@class='author-card__name']/a last update: 2022-04-02T19:14:47+09:00
-
スポーツ報知 2018-07-19T01:18:34+09:00
title //h1[contains(@class,'ar_title')] exampleUrl https://www.hochi.co.jp/entertainment/20180718-OHT1T50134.html url ^https?://www\.hochi\.co\.jp/[^/]*/[0-9]*- author tag pageElement //div[contains(@id,'NWrelart:Body')]/node()[contains(@itemprop,'articleBody')] subtitle firstPageLink nextLink memo last update: 2018-07-19T01:18:34+09:00
-
5ch 2018-07-18T21:31:12+09:00
title //h1[contains(@class,'title')] exampleUrl https://mevius.5ch.net/test/read.cgi/bookall/1531814351/ url ^https?://[^.]*\.5ch\.net/test/read.cgi/ author tag pageElement //div[contains(@class,'message')]|//div[contains(@class,'meta')]/span[contains(@class,'name')] subtitle firstPageLink nextLink memo last update: 2018-07-18T21:31:12+09:00
-
弁護士ドットコム NEWS 2018-07-18T20:17:19+09:00
title //h1[contains(@class,'p-topics-article-header__title')] pageElement //div[contains(@class,'p-topics-article__body')] url ^https?://www\.bengo4\.com/[^/]*/[^/]*/ exampleUrl https://www.bengo4.com/internet/n_8228/ author //div[contains(@class,'topics-author__info')]/a[contains(@class,'topics-author__link')]/text() last update: 2021-10-14T15:55:45+09:00
-
日本経済新聞 2018-07-18T20:03:56+09:00
title //h1[contains(@class,'article_title')] pageElement //main/article/section nextLink //a[img/@title='次へ' or .='次へ'] tag //div[contains(@class,'relatedTags')]/a|//dd[contains(@class,'cmnc-tag')]/a url ^https?://www\.nikkei\.com/article/ exampleUrl https://www.nikkei.com/article/DGXMZO33065110X10C18A7MM8000/ last update: 2020-11-29T00:04:21+09:00
-
SPUTNIK 2018-07-18T19:23:15+09:00
title //div[contains(@class,'article__header')]/h1 exampleUrl https://jp.sputniknews.com/science/201807165124528/ url ^https?://jp\.sputniknews\.com/[^/]*/ author tag //div[contains(@class,'article__refs-tags')]/a pageElement //div[contains(@itemprop,'articleBody')] subtitle firstPageLink nextLink memo last update: 2018-07-18T19:23:15+09:00
-
Make: blog 2018-07-18T19:13:47+09:00
title //div[contains(@class,'top_article')]//h1 exampleUrl http://makezine.jp/blog/2018/07/how-to-make-and-run-alife.html tag //div[contains(@class,'box-tag')]/ul/li/a author //p[contains(@class,'author')]/text() url ^https?://makezine\.jp/blog/ pageElement //div[contains(@role,'main')]/article/*[not(contains(@class,'top_article')) and not(contains(@class,'box_meta')) and not(a/noscript)] last update: 2018-07-19T23:50:51+09:00
-
日経ビジネス ONLINE 2018-07-18T18:58:47+09:00
title //main//article//header/h1 pageElement //main//article//div[contains(@class,'articleBody')]/*[not(contains(@class,'bpbox'))] tag //main//article//footer//li[contains(@class,'article_tags_item')]/a[contains(@href,'/tag/')] url ^https://business\.nikkei\.com/atcl/[^/]+/\d+/\d+/\d+/ exampleUrl https://business.nikkeibp.co.jp/atcl/opinion/15/218009/071700165/ author //main//article//header//address[contains(@class,'author_name')] last update: 2021-06-01T11:13:28+09:00
-
GigaZiNE 2018-07-18T18:50:43+09:00
title //h1[contains(@class,'title')] pageElement //div[contains(@class,'cntimage')]/*[not(child::time) and not(@class='title') and not(child::div[@id='URLClip']) and not(self::style)] tag //span[contains(@class,'p-category')]/a url ^https?://gigazine\.net/news/ exampleUrl https://gigazine.net/news/20180718-why-banned-from-airbnb/ last update: 2021-07-09T12:59:35+09:00