firstPageLink | |
---|---|
exampleUrl | https://rollingstonejapan.com/articles/detail/32058?n=1&e=32077 |
memo | |
tag | //div[contains(@class,'articleDetailTag')]/ul/li/a |
nextLink | //div[contains(@class,'contBtn')]/a[1] |
author | //p[contains(@class,'name')]/a |
subtitle | |
title | //h1[contains(@class,'tit')] |
url | ^https://rollingstonejapan\.com/articles/detail/[0-9]* |
pageElement | //div[contains(@class,'kizi-honbun')] |
Database: ことせかいWebページ読み込み用情報
ことせかい という読み上げアプリで利用するデータです。
Webで読める小説を取り込むために、文書の場所や次のページへのlinkなどをさすxpathを記述します。
幾つかの項目はAutopagerizeとほぼ同じ意味です。
ことせかい については以下のURLを参照してください。
http://limura.github.io/NovelSpeaker/
以下、個々の属性についての概ねの方針を書いておきます。
url
対象のURLしてヒットする正規表現を書きます。
pageElement
読み上げ対象となる文字列が含まれるエレメントを取り出すxpathを書きます。複数hitするようなxpathを書いた場合、その全てが取り出されます。
nextLink
次のページに続く場合のaタグを指定するxpathを書きます。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
Autopagerize側では必須属性になっていますが、こちらでは必須ではありません。つまり、Autopagerizeは(その目的から)1ページに全てが入っているサイトは登録されていませんので、そのようなサイトはこちらに登録する必要があります。また、Autopagerize側で主題が違う記事へのnextLinkが指定されているものについて、こちら側のデータベースにnextLinkが無い状態で登録することによって、主題が違う記事を読み込まないようにする事もできなくもありません。
title
本棚に登録される時の名前として採用される文字列を含むエレメントを取り出すためのxpathを書きます。
subtitle
(2017/12/18: 将来的に利用するための項目です)小説の個々の章にあたるサブタイトルを抽出できるエレメントを取り出すためのxpathを書きます。
author
作者名として採用される文字列を含むエレメントを指定するxpathを書きます。
firstPageLink
小説のタイトルページ(本文は含まない)がある場合、そのタイトルページから本文のページに遷移するためのaタグを指定します。複数hitするものを書いた場合、最初のエレメントだけが採用されます。
注意:firstPageLink にヒットした場合、そのURLを読み直して評価をし直すため、無限に firstPageLink の読み込み先を読んで場合があります。そのようにならないように firstPageLink の xpath を指定してください。
tag
その小説等に関する文字列タグが列挙されているエレメントがある場合は指定します。将来的に小説の検索などに使われるタグとして利用されるつもりのものになります。幾つかターゲットを書いてみたところ、どうやら Aレコード でタグへのlinkになっているものが多いようで、その場合は内部にスペースがあるタグなども見受けられましたため、Aレコードのようなエレメント毎に一つのタグとして取り込めないかな?と思っています。ということでできればAレコードそのものを取り出すように(a/text() のような XPath を書いてテキストだけにしないように)して頂ければ幸いです。
isNeedHeadless
JavaScriptが動作した後に本文部分(pageElement)が生成される場合には何らかの値("true"が推奨)を入れます。"false" や "False", "nil", "0", ""(何も入れない) の場合には単にGETリクエストで取得された値について評価して良いという意味になります。
nextButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を次へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、nextLink よりも nextButton の方が先に評価されます(nextButton と nextLink が両方共に存在する場合は nextButton が優先されます)。
firstPageButton
isNeedHeadless が有効になっている場合、ここで指定される要素の最初の物を最初の本文へのリンクとみなして .click() が実行されます。なお、この要素については xpath ではなく CSS selector で表記します(できればxpathにしたいのですが……)。なお、firstPageLink よりも firstPageButton の方が先に評価されます(firstPageButton と firstPageLink が両方共に存在する場合は firstPageButton が優先されます)。
forceClickButton
(実験的機能なので将来的に変更される可能性があります)isNeedHeadless が有効になっている場合、ここで指定される要素が存在した場合はその要素に対して .click() が実行された後、改めて内容を評価し直します。特定のボタンを押さないと先に進めない場合などに利用します。
waitSecondInHeadless
isNeedHeadless が有効になっている場合、ページが読み込まれたと思われる後、さらにここで指定される数値で指定される秒数待った後にinnerHTMLを評価します。
injectStyle
pageElement で取り出した後のHTMLに対して強制的に適用するstyleを記述します。これは、pageElementで取り出した後のHTMLにはstyleが適用されない(パスが違うのでstyleが適用されないであるとか、pageElementで取り出されたHTMLにはstyleが無いであるとか、styleは別のファイルになっているのでGETリクエスト一回では取り出せないであるといったときに、white-space:pre-wrap; で指定されるようなコンテンツが入っているとHTMLからStringに変換した時に改行周りとかが省略されてしまって悲しいことになるという問題を回避するための物になります。(例えば、pageElement として <div class="content xxx yyy">...</div> が取り出されるのがわかっている場合、"div.content{white-space:pre-wrap;}" といったような値を指定する事を期待しています。
exampleUrl
対象のURLを書きます。後で動作確認などをする時に利用します。複数書く場合は半角スペースで区切ってください。
memo
何らかのメモ書きを残すべきと思った場合は書いておいてください。日本語でOKです。
また、次のページや最初のページを判定するための要素がいくつかあるのでそれらの優先順位を別途書き記しておきます。
優先される順序は
1. forceClickButton
2. nextButton
3. firstPageButton
4. nextLink
5. firstPageLink
の順(数字が若い方が優先)になります。
なお、ことせかい の動作としては、このデータベースとAutopagerizeのデータベースの両方を使ってデータを読み込むように作られています。
動作としては対象のURLについて、まずこちらのデータベースにあるものが優先され、こちらのデータベースに載っていないURLのものについてはAutopagerizeのデータベースを参照することになります。
ですので、Autopagerize側で定義されている情報で十分なものの場合は改めてこちら側のデータベースに登録する必要は無いかもしれません。
Last Update: 2024-04-16T12:03:19+09:00 History
Item List
-
RollingStone Japan 2019-10-06T16:11:24+09:00
last update: 2019-10-06T16:11:24+09:00
-
ポケモン小説スクエア 2019-10-01T11:04:37+09:00
exampleUrl https://pokemon.sorakaze.info/shows/story/12249 https://pokemon.sorakaze.info/shows/shortstory/2243/ firstPageLink //div[contains(@class,'stories-table')]//div[contains(@class,'text')]/a|//div[@id='main-novel']/section/p/a[contains(@href,'/shows/shortstory/')] author //div[@id='author']/a nextLink //div[@id='novel-navigation']/a[contains(text(),'次へ進む')] subtitle //div[@id='main-single']/h1[1] title //div[contains(@class,'bread-crumb')]/ul/li/a[contains(@href,'/shows/index/')][1] pageElement //div[@id='novel-body' or @id='novel-foreword'] url ^https://pokemon\.sorakaze\.info/shows/(index|story|shortstory)/ last update: 2019-10-02T11:39:10+09:00
-
電撃オンライン(articles) 2019-09-23T01:57:36+09:00
firstPageLink exampleUrl https://dengekionline.com/articles/12071/ memo tag nextLink author //dl[contains(@class,'gEntry_athorList')]//a[contains(@href,'/authors/')] subtitle title //h1[contains(@class,'gEntry_title')] url ^https://dengekionline\.com/articles/[0-9]*/ pageElement //div[contains(@class,'gEntry_body')] last update: 2019-09-23T01:57:36+09:00
-
R25 2019-09-16T14:31:19+09:00
firstPageLink exampleUrl https://r25.jp/article/721630611537498701 memo tag nextLink author subtitle title //h1[@class='Heading'] url ^https?://r25\.jp/article/[0-9]+ pageElement //div[@class='Article']//*[contains(@class,'TextItem') or contains(@class,'BooksHeadingItem')] last update: 2019-09-16T14:31:19+09:00
-
Engadget Japan 2019-09-16T07:43:34+09:00
firstPageLink exampleUrl https://japanese.engadget.com/2019/09/15/apple-tv-1-26/ memo tag //footer//span/a[contains(@href,'/tag/')] nextLink author //header//div[contains(@class,'o-feed_listing')]//section//a[contains(@href,'/about/editors/')] subtitle //header//div[contains(@class,'o-feed_listing')]//h2 title //header//div[contains(@class,'o-feed_listing')]//h1 url ^https?://japanese\.engadget\.com/[0-9]+/[0-9]+/[0-9]+/[^/]+/ pageElement //div[contains(@class,'article-text')] last update: 2019-09-16T07:43:34+09:00
-
gamebiz.jp 2019-09-10T00:50:13+09:00
firstPageLink exampleUrl https://gamebiz.jp/?p=248199 memo tag //div[contains(@class,'CategoriyTag')]/a nextLink author subtitle title //div[contains(@class,'article_view')]/header/h1 url ^https://gamebiz\.jp/\?p= pageElement //div[contains(@class,'article_body_view')] last update: 2019-09-10T00:50:13+09:00
-
東京ビッグサイト誕生秘話 2019-08-15T02:20:12+09:00
firstPageLink //div[contains(@class,'main')]/div[contains(@class,'main_index')]//td/a exampleUrl http://www7a.biglobe.ne.jp/~tsudax99/bigsight_hiwa/index_hiwa.html memo tag nextLink //div[contains(@class,'footer2')]/ul[contains(@class,'nav')]/li/a[contains(text(),'次に進む')] author //div[@id='since'] subtitle //div[contains(@class,'honbun')]/div[contains(@class,'contents')]/h2 title //div[@id='title']/h3 url ^https?://www7a\.biglobe\.ne\.jp/~tsudax99/bigsight_hiwa/ pageElement //div[contains(@class,'honbun')]/div[contains(@class,'contents')] last update: 2019-08-15T02:20:12+09:00
-
5ch 2019-07-03T19:55:56+09:00
title //div[@id='threadtitle']|//h1[@class='title'] pageElement //article[@id]//span[@class='postid']|//article[@id]//section[@class='post-content']|//div[@class='thread']/div[@class='post']/div[@class='message']/span[@class='escaped'] nextLink //article[@id='950' or @id='951' or @id='952' or @id='953' or @id='954' or @id='955' or @id='956' or @id='957' or @id='958' or @id='959' or @id='960' or @id='961' or @id='962' or @id='963' or @id='964' or @id='965' or @id='966' or @id='967' or @id='968' or @id='969' or @id='970' or @id='971' or @id='972' or @id='973' or @id='974' or @id='975' or @id='976' or @id='977' or @id='978' or @id='979' or @id='980' or @id='981' or @id='982' or @id='983' or @id='984' or @id='985' or @id='986' or @id='987' or @id='988' or @id='989' or @id='990' or @id='991' or @id='992' or @id='993' or @id='994' or @id='995' or @id='996' or @id='997' or @id='998' or @id='999' or @id='1000']//section[@class='post-content']/a[contains(@href,'/test/read.cgi/') and not(@rel)][last()]|//div[@class='meta']/span[@class='number' and starts-with(text(), '9') and string-length(text()) = 3]/parent::div[@class='meta']/following-sibling::div[@class='message']/span[@class='escaped']/a[contains(@href, 'https://') and contains(@href,'.com/test/read.cgi/')] url https://[a-z]+\.[a-z]+\.com/test/read\.cgi/[a-z]+/[0-9]+/ last update: 2023-12-31T12:48:43+09:00
-
エブリスタ 2019-06-03T01:34:44+09:00
title //title pageElement //div[@class='mainBody']/div[@class='body'] subtitle //header//div[@class='info'] firstPageLink //div[@class='novelData']//div[@class='info' and child::h1]//div[@class='readButton']/a nextLink //link[@rel='next'] tag //div[contains(@class,'tags')]/a url ^https://estar\.jp/novels/ exampleUrl https://estar.jp/novels/25330938/viewer?page=2 injectStyle div.content{white-space:pre-wrap;} last update: 2024-02-28T18:53:59+09:00
-
ノベルアップ+ 2019-05-29T23:39:27+09:00
title //div[contains(@class,'novel_title')] pageElement //div[@id='section_episode']//div[contains(@class,'content_inner')]//div[contains(@class,'content')] subtitle //div[contains(@class,'episode_title')] firstPageLink //div[contains(@class,'episode_link')]/a nextLink //div[@id='section_episode']/div[contains(@class,'move_set')]//a[child::p[contains(text(),'次へ')]] tag //div[contains(@class,'info_table')]/dl/div[child::dt[contains(text(),'タグ')]]/dd/a url ^https://novelup\.plus/story/ exampleUrl https://novelup.plus/story/579188443/668482998 injectStyle *{white-space:pre-wrap;} author //div[contains(@class,'novel_author')] last update: 2020-08-25T17:28:14+09:00
-
起点中文網 2019-05-13T16:06:24+09:00
title //div[contains(@class,'book-info')]/h1/em|//div[@class='wrap']//div[@class='crumbs-nav']/a[@class='act' and contains(@href,'/info/') and @id='bookImg'] pageElement //div[contains(@class,'main-text-wrap')]/div[contains(@class,'read-content')]/p/span[@class='content-wrap'] forceClickButton body div a#close subtitle //h3[contains(@class,'j_chapterName')] firstPageLink //div[contains(@class,'book-information')]//a[contains(@href,'/chapter/') and @data-firstchapterjumpurl] isNeedHeadless true nextLink //a[@id='j_chapterNext' and contains(@href,'/chapter/')] tag //div[contains(@class,'book-info')]//p[@class='tag']/* url ^https://(book|read)\.qidian\.com/(info|chapter)/ exampleUrl https://read.qidian.com/chapter/KcOfr1rGlj_Vl9ByXxZ_TQ2/i_nemEneLgzM5j8_3RRvhw2 injectStyle .read-content { line-height: 1.8; }; .p { word-break: break-all; } author //div[contains(@class,'book-info')]//a[@class='writer' and contains(@href,'/author/')]|//div[contains(@class,'main-text-wrap')]/div[@class='text-head']/div[contains(@class,'text-info')]/div[contains(@class,'info')]/a[contains(@href,'/author/')] last update: 2022-12-18T22:11:34+09:00
-
セルバンテス 2019-05-13T15:56:26+09:00
title //div[contains(@class,'p-edit-form__title--works')]/p/a[contains(@href,'/story/p/')] exampleUrl https://cervan.jp/story/c/30424 url ^https://cervan.jp/story/[pc]/ author //div[contains(@class,'p-edit-form__title--works')]/p/a[contains(@href,'/profile/')] tag pageElement //div[contains(@class,'c-episode__text')] subtitle //p[contains(@class,'c-episode__title')] firstPageLink //ul[contains(@class,'p-works__index--episode')]/li/a nextLink //li[contains(@class,'c-button__pager--next')]/a memo last update: 2019-05-13T15:56:26+09:00
-
NOVEL DAYS 2019-05-13T15:49:34+09:00
title //div[@id='main']//div[contains(@class,'title')] pageElement //div[contains(@class,'episode')]/div[contains(@class,'inner')] subtitle //div[contains(@class,'episode')]/h1 firstPageLink //div[@id='main']//div[@class='contents']/ol/li/a[contains(@href,'/works/episode/')] nextLink //div[@id='scroll']//p[contains(@class,'arrowR')]/a tag //div[contains(@class,'detail')]/ul[@class='tag']/li/a[contains(@href,'/tags/')] url ^https://novel\.daysneo\.com/works/ exampleUrl https://novel.daysneo.com/works/episode/dd390de44284431cce18338a9f379333.html author //a[contains(@href,'/author/') and not(child::img)] last update: 2021-02-19T17:04:41+09:00
-
magNET (マグネット!) 2019-02-05T09:53:30+09:00
title //h1[contains(@class,'headline-novel-title')] exampleUrl https://www.magnet-novels.com/novels/57390/episodes/105192 author //div[contains(@class,'info')]//a/span[contains(@class,'name')] url ^https://www\.magnet-novels\.com/novels/[0-9]* subtitle //h2/span[contains(@class,'episode-title')] pageElement //div[contains(@class,'reading-text')] firstPageLink //div[contains(@class,'sections')]/div[contains(@class,'episode')]/a memo m.magnet-novels.com は別口で作ったほうがよさそうです nextLink //li[@title='次のページへ']/a last update: 2019-02-05T09:57:32+09:00
-
FC2ブログ(category?) 2018-12-03T19:53:25+09:00
title //h2[@id='entry']/center/a[contains(@href,'blog-category')] exampleUrl http://yuganda.blog114.fc2.com/blog-entry-1.html author //div[contains(@class,'copyright')]/a[@href='./'] url ^https?://.*blog.*fc2\.com/blog-(entry|category)-[0-9]*.html subtitle //div[contains(@class,'p_main-body')]/h2[@id='entry-1'] pageElement //div[@class='p_main-body']/div[contains(@class,'entry_text2') and not(child::*[contains(text(), '上記の広告は1ヶ月以上更新のないブログに表示されています')])] firstPageLink //a[@id='1'] memo FC2ブログは色々な形式があるので多分一部のものにしか対応できていないと考えられます。 nextLink //ul[contains(@class,'entry_navi')]/li/a[contains(@href,'fc2.com/blog-entry-') and contains(text(),'Next')] last update: 2018-12-03T20:03:04+09:00
-
ツギクル 2018-11-30T06:27:09+09:00
exampleUrl https://www.tugikuru.jp/novel/content?id=33968 url ^https://www\.tugikuru\.jp/novel/content\?id= pageElement //p[@class='contents_description'] firstPageLink //a[@class='novel_title_link'] last update: 2018-11-30T06:28:07+09:00
-
NewsWalker 2018-10-18T18:57:36+09:00
title //h1[contains(@class,'heading')] exampleUrl https://news.walkerplus.com/article/51918/ tag //div[contains(@class,'lo__page__body__main')]//ul[contains(@class,'list_terms')]/li/a url ^https://news\.walkerplus\.com/article/ pageElement //div[contains(@class,'article__body')] last update: 2018-11-30T06:24:44+09:00
-
maisov.if.tv 2018-10-17T14:50:28+09:00
title //h1[contains(@class,'title')] exampleUrl http://maisov.if.tv/r/index.php?nforeword url ^https?://maisov\.if\.tv/r/index.php author tag pageElement //div[@id='body' or @id='note'] subtitle firstPageLink nextLink //div[@id='body']/p/a[contains(text(),'次話へ')]|//div[@id='body']/p[contains(text(),'に続く')]/a[contains(@href,'index.php?')] memo pukiwiki への対応は難しい…… last update: 2018-10-17T14:50:28+09:00
-
モバスペbook 2018-08-31T13:38:52+09:00
title //title exampleUrl http://mbbook.jp/bo2.php?ID=4yfns&no=2578952&page2=1&guid=on&pagecnt=1 url ^https?://mbbook\.jp/bo2.php pageElement //body/*[not(self::center) and not(self::a)]|//body/text() nextLink //center/a[contains(text(),'次㌻')] last update: 2018-08-31T20:54:41+09:00
-
Rocket News 24 2018-08-23T05:39:58+09:00
exampleUrl https://rocketnews24.com/2018/03/06/1028499/ tag //div[contains(@class,'post-footer')]/ul[contains(@class,'post-meta')]/li[contains(@class,'tags')]/a author //ul[contains(@class,'post-meta')]/li[contains(@class,'author')]/a title //h2[contains(@class,'entry-title')] pageElement //div[contains(@class,'entry-content')]/*[not(child::img)] url ^https://rocketnews24\.com/[0-9]*/[0-9]*/[0-9]*/[0-9]*/ last update: 2019-08-28T20:17:25+09:00
-
AERA dot. 2018-08-17T01:15:00+09:00
pageElement //div[contains(@class,'atclTxtMain')]/p[contains(@class,'nTxt')] author //span[contains(@class,'atclAuthorTxt')] firstPageLink //p[contains(@class,'foldedAreaReadmore')]/a title //div[contains(@class,'content')]/h1 exampleUrl https://dot.asahi.com/aera/2018080800079.html https://dot.asahi.com/aera/2018080800079.html?page=1 nextLink //div[contains(@class,'articleTitlePager')]/a|//nav[@class='articlePager']//li[@class='articlePagerNext']/a url ^https://dot\.asahi\.com/(aera|dot)/ last update: 2020-05-15T19:41:53+09:00
-
Daily Portal Z 2018-08-16T13:23:57+09:00
title //title exampleUrl http://portal.nifty.com/kiji/180816203686_1.htm https://dailyportalz.jp/kiji/180816203686 author //div[contains(@class,'contentblock')]//div[contains(@class,'writer-detail')]//span[contains(@class,'name')]/span/a url ^https://dailyportalz\.jp/kiji/ pageElement //div[contains(@class,'contentblock')] nextLink //div[@id='links']/b/following-sibling::a[1] last update: 2018-10-18T10:53:08+09:00
-
食べログ/日記 2018-08-14T01:17:26+09:00
title //p[contains(@class,'d-title')]/a/span[contains(@class,'title')] exampleUrl https://tabelog.com/rvwr/takemachelin/diarydtl/150704/ url ^https://tabelog\.com/[^/]*/[^/]*/diarydtl/ author //div[contains(@class,'header-contents')]//p[contains(@class,'rvwr-status')]/span[contains(@class,'rvwr-status__nickname')] tag pageElement //div[contains(@class,'diary-body')] subtitle firstPageLink nextLink memo last update: 2018-08-14T01:17:26+09:00
-
BCN+R 2018-08-13T06:12:50+09:00
title //h1[contains(@class,'article-title')] exampleUrl https://www.bcnretail.com/market/detail/20180812_81432.html url ^https://www\.bcnretail\.com/[^/]*/detail/ author tag pageElement //div[contains(@class,'article-body')] subtitle firstPageLink nextLink memo last update: 2018-08-13T06:12:50+09:00
-
ぐるなびをちょっと良くするエンジニアブログ 2018-08-08T20:30:32+09:00
title //h1[contains(@class,'entry-title')] exampleUrl http://developers.gnavi.co.jp/entry/bento_takuben/ url ^https?://developers\.gnavi\.co\.jp/entry/ author //div[contains(@class,'author-profile')]//div[contains(@class,'author-name')]/a tag pageElement //div[contains(@class,'entry-content')]/*[not(self::div[contains(@class,'author-profile')])] subtitle firstPageLink nextLink memo last update: 2018-08-08T20:30:32+09:00
-
リクナビNEXTジャーナル 2018-08-08T19:29:58+09:00
title //div[contains(@class,'article__header')]/h1 exampleUrl https://next.rikunabi.com/journal/20180808_c02/ url ^https?://next\.rikunabi\.com/journal/ author //div[contains(@class,'article__body')]/div[contains(@class,'block_content_1px')]/h4 tag //ul[contains(@class,'tag_list')]/li/a pageElement //div[contains(@class,'article__body')]/*[not(self::div[contains(@class,'block_content_1px') or contains(@class,'article__footer')]) and not(self::h2[contains(@class,'related_tags')]) and not(self::ul[contains(@class,'tag_list')])] subtitle firstPageLink nextLink memo last update: 2018-08-08T19:29:58+09:00
-
WIRED series 2018-08-08T03:18:19+09:00
title //h2[contains(@class,'page-heading')]/a[not(text()='SERIES')] exampleUrl https://wired.jp/series/silk-road/2_virtual-life/ author //div[contains(@class,'series-prof')]/section/p[contains(@class,'prof-txt')] url ^https?://wired\.jp/series/[^/]*/ subtitle //div[contains(@class,'text-title')]/h3 pageElement //div[contains(@class,'paragraph')]|//section[contains(@class,'text-body')]/*[not(self::ul[contains(@class,'next-prev-nav')]) and not(self::div[contains(@class,'text-title') or contains(@class,'social-area-syncer')]) and not(self::script)] firstPageLink //div[contains(@class,'series_section')]/div/article[last()]/a nextLink //ul[contains(@class,'next-prev-nav')]/li[contains(@class,'prev')]/a last update: 2018-08-08T03:41:58+09:00
-
tubotax.com 2018-08-08T01:45:32+09:00
title //title exampleUrl https://blog.tsubotax.com/n/n80412ab1e8b4 tag //li[contains(@class,'hashtags')]/span/a author //div[contains(@class,'p-articleNoteInfo__user')]//div/p//a/span url ^https://blog\.tsubotax\.com/n/ pageElement //div[contains(@class,'body-wrapper')] last update: 2018-08-08T01:46:10+09:00
-
ScanNetSecurity 2018-08-08T01:06:02+09:00
title //header[contains(@class,'arti-header')]/h1[contains(@class,'head')] exampleUrl https://scan.netsecurity.ne.jp/article/2018/08/06/41257.html url ^https://scan\.netsecurity\.ne\.jp/article/ author //span[contains(@class,'writer-name')] tag pageElement //article[contains(@class,'arti-body')] subtitle firstPageLink nextLink //ul[contains(@class,'paging-list')]/li[contains(@class,'paging-next')]/a memo last update: 2018-08-08T01:06:02+09:00
-
エンジニアtype(@type) 2018-08-08T00:56:20+09:00
title //header[@id='postHeader']/h1 exampleUrl https://type.jp/et/feature/8390 url ^https?://type\.jp/et/[^/]*/ author tag //header[@id='postHeader']//ul[contains(@class,'tag_inner')]/li/a pageElement //section[@id='single_post']/*[not(self::header) and not(self::div[contains(@class,'sns_share_list')])] subtitle firstPageLink nextLink memo last update: 2018-08-08T00:56:20+09:00
-
MOONGIFT 2018-08-07T22:28:12+09:00
title //h1[contains(@class,'title')] exampleUrl https://www.moongift.jp/2018/08/tabspeech-web%E3%83%9A%E3%83%BC%E3%82%B8%E3%82%92%E8%AA%AD%E3%81%BF%E4%B8%8A%E3%81%92%E3%82%8Bgoogle-chrome%E6%A9%9F%E8%83%BD%E6%8B%A1%E5%BC%B5/ url ^https://www\.moongift\.jp/[0-9]*/[0-9]*/ author tag //ul[contains(@class,'tags')]/li/a|//ul[contains(@class,'category')]/li/a pageElement //div[contains(@class,'post_body')]/*[not(self::span[@id='premium_content_introduce']) and not(self::div[@id='mg-share'])] subtitle firstPageLink nextLink memo last update: 2018-08-07T22:28:12+09:00
-
iPhone Mania 2018-08-05T13:50:30+09:00
title //div[@class='single_title']/h1 pageElement //div[@id='single_content'] tag //div[@id='category_tag']/a[contains(@rel,'tag')] url ^https://iphone-mania\.jp/news- exampleUrl https://iphone-mania.jp/news-220859/ last update: 2020-10-17T01:52:11+09:00
-
価格.com マガジン 2018-08-05T02:45:59+09:00
title //h1[contains(@class,'article-title')] exampleUrl https://kakakumag.com/camera/?id=12556 url ^https://kakakumag\.com/[^/]*/ author //div[contains(@class,'article-credit')]/div/p[contains(@class,'article-credit-writer')]/a tag pageElement //div[contains(@class,'article-edit')] subtitle firstPageLink nextLink memo last update: 2018-08-05T02:45:59+09:00
-
日刊SPA! 2018-08-04T03:13:38+09:00
title //div[contains(@class,'post-title')]/h1 exampleUrl https://nikkan-spa.jp/1497990?display=b url ^https://nikkan-spa\.jp/ author //div[contains(@class,'writer-info')]/div[contains(@class,'writer-name')] tag //div[contains(@class,'tag-list')]//span[contains(@class,'tag')] pageElement //div[contains(@class,'post-container')]/*[not(self::script) and not(self::div[contains(@class,'post-pager') or contains(@class,'freeHtmlArea') or contains(@class,'reading-posts') or contains(@class,'last-series') or contains(@class,'tag-box') or contains(@class,'sns-box') or contains(@class,'ad-area') or contains(@class,'rerated-posts') or contains(@class,'writer-box')])] subtitle firstPageLink nextLink //div[contains(@class,'post-pager') and contains(@class,'Horizontal')]/a memo last update: 2018-08-04T03:13:38+09:00
-
ヌートン 2018-08-03T21:13:12+09:00
title //h3[contains(@class,'title')] exampleUrl https://nuwton.com/feature/31826/ url ^https://nuwton\.com/feature/ author //div[contains(@class,'header')]/div[contains(@class,'writer')]/a tag pageElement //article[contains(@class,'article-detail')]/div[contains(@class,'article-body')] subtitle firstPageLink nextLink memo last update: 2018-08-03T21:13:12+09:00
-
MOREWORKS インタビュー 2018-08-03T12:07:02+09:00
title //h1[contains(@class,'title')] exampleUrl https://www.moreworks.jp/interviews/17 url ^https://www\.moreworks\.jp/interviews/ author tag pageElement //div[contains(@class,'l-interview-body-inner')]/*[not(self::div[contains(@class,'p-share')])] subtitle firstPageLink nextLink memo last update: 2018-08-03T12:07:02+09:00
-
AFP BB NEWS 2018-08-03T09:58:09+09:00
title //h1[contains(@class,'title')] exampleUrl http://www.afpbb.com/articles/-/3184426 url ^https?://www\.afpbb\.com/articles/ pageElement //article[@id='article-contents']/*[not(self::header[contains(@class,'article-signage')]) and not(self::section[contains(@class,'article-sns')]) and not(self::div[contains(@class,'subcate-bottom') or contains(@class,'article-category') or contains(@class,'article-buy') or contains(@class,'next-title')]) and not(self::ul[contains(@class,'pager')])] nextLink //div[contains(@class,'next-title')]/a last update: 2018-08-16T05:59:28+09:00
-
JIJI.COM 2018-08-03T01:20:59+09:00
title //div[contains(@class,'ArticleTitle')]/h1 pageElement //div[contains(@class,'ArticleText')] tag //div[contains(@class,'ArticleKeyword')]//a url ^https://www\.jiji.com/[^/]*/(article|v8) exampleUrl https://www.jiji.com/jc/article?k=2018080200032&g=int last update: 2022-05-03T01:03:32+09:00
-
KOBITブログ 2018-08-03T00:46:19+09:00
title //h1[@id='main-title'] exampleUrl https://kobit.in/archives/11994 tag //div[contains(@class,'tags')]/span/a url ^https://kobit\.in/archives/ pageElement //div[contains(@class,'editor-area')]/*[not(self::div[contains(@class,'wp_social_bookmarking')]) and not(self::div[contains(@class,'yarpp-related')]) and not(child::noscript)] last update: 2018-08-03T01:11:17+09:00
-
Amazon Web Services ブログ 2018-08-02T22:35:40+09:00
title //h1[contains(@class,'blog-post-title')] exampleUrl https://aws.amazon.com/jp/blogs/news/viewing-amazon-elasticsearch-service-error-logs/ url ^https://aws\.amazon\.com/[^/]*/blogs/ author //span[contains(@property,'author') and contains(@typeof,'Person')]/a tag pageElement //section[contains(@class,'blog-post-content')] subtitle firstPageLink nextLink memo last update: 2018-08-02T22:35:40+09:00
-
PLAID 2018-08-02T22:03:05+09:00
title //h1[contains(@class,'title')] exampleUrl https://tech.plaid.co.jp/multiprocess-app-on-ios/ url ^https://[^.]*\.plaid\.co\.jp/ author //section[contains(@class,'authorprofile')]//div[contains(@class,'info')]/div[contains(@class,'meta')]/h3/a tag //ul[contains(@class,'meta')]/li[contains(@class,'category')]/a pageElement //section[contains(@class,'postcontents')] subtitle firstPageLink nextLink memo last update: 2018-08-02T22:03:05+09:00
-
GeekOut コラム 2018-08-02T17:42:02+09:00
title //h1[contains(@class,'entry-title')] exampleUrl https://geek-out.jp/column/entry/2018/08/02/110000 url ^https://geek-out\.jp/column/entry/ author tag pageElement //div[contains(@class,'entry-content')] subtitle firstPageLink nextLink memo last update: 2018-08-02T17:42:02+09:00
-
Developers.IO 2018-08-01T15:09:53+09:00
title //h1[contains(@class,'single_article_title')] exampleUrl https://dev.classmethod.jp/rd/yokota-de-go/ url ^https://dev\.classmethod\.jp/[^/]*/ author //li[contains(@class,'author')]/a tag //li[contains(@class,'term_item')]/a pageElement //div[contains(@class,'single_article_contents')] subtitle firstPageLink nextLink memo last update: 2018-08-01T15:09:53+09:00
-
Medium 2018-08-01T14:31:29+09:00
title //title pageElement //section//div//*[@id and not(self::figure)] tag //a[contains(@href,'/tagged/')] url ^https://medium\.com/[^/]*/ exampleUrl https://medium.com/@yukaiwasaki/10%E5%B9%B4%E5%BE%8C%E3%81%AE%E8%BB%A2%E8%81%B7%E5%B8%82%E5%A0%B4%E3%81%A7%E8%B5%B7%E3%81%8D%E3%82%8B%E3%81%93%E3%81%A8-20d27f81f451 last update: 2020-09-18T11:56:18+09:00
-
Books & Apps 2018-07-31T18:56:05+09:00
title //article[@id='article']/header/h1 pageElement //*[@itemprop='articleBody']/*[not(contains(@class,'g-46'))] tag //ul[contains(@class,'tags')]/li/a url ^https?://blog\.tinect\.jp/ exampleUrl https://blog.tinect.jp/?p=52894 author //ul[contains(@class,'tags')]/li[contains(@class,'author')]/a last update: 2020-10-06T16:49:05+09:00
-
Real Sound 2018-07-31T18:32:07+09:00
title //h1[contains(@itemprop,'headline')] exampleUrl http://realsound.jp/movie/2018/07/post-228005.html url ^https?://realsound\.jp/[^/]*/[0-9]*/[0-9]*/ author tag //dl[contains(@itemprop,'keywords')]/dd/a pageElement //div[contains(@itemprop,'articleBody')] subtitle firstPageLink nextLink //div[@id='nextPageTitle']/a memo last update: 2018-07-31T18:32:07+09:00
-
KULTER 2018-07-31T11:44:22+09:00
title //h1[contains(@class,'ently_title')] exampleUrl http://kultur2.blog.fc2.com/blog-entry-4277.html url ^https?://kultur2?\.blog\.fc2.com/blog-entry- author tag //ul[contains(@class,'entry_date')]/li/a|//div[contains(@class,'tag_list')]/a pageElement //div[contains(@class,'ently_text')]/*[not(self::ul[contains(@class,'snsb')])]|//div[contains(@class,'comment_body')]/div[contains(@class,'comment_text')] subtitle firstPageLink nextLink memo last update: 2018-07-31T11:44:22+09:00
-
週プレNEWS 2018-07-27T20:08:07+09:00
title //h1[contains(@class,'block-detail-b-a__label')] exampleUrl https://wpb.shueisha.co.jp/news/entertainment/2018/07/27/106685/ url ^https?://wpb\.shueisha\.co\.jp/news/ author tag pageElement //div[@id='js-post-detail-body'] subtitle firstPageLink nextLink memo last update: 2018-07-27T20:08:07+09:00
-
Yahoo! ニュース headline 2018-07-27T17:05:29+09:00
title //div[contains(@class,'article')]/div[contains(@class,'hd')]/h1 exampleUrl https://headlines.yahoo.co.jp/videonews/fnn?a=20180727-00397306-fnn-soci url ^https?://headlines\.yahoo\.co\.jp/[^/]*/ author tag //ul[@id='yjSLinkLst']/li[contains(@class,'yjSLinkItm')]/a pageElement //div[contains(@class,'articleMain')]/text() subtitle firstPageLink nextLink memo last update: 2018-07-27T17:05:29+09:00
-
宮崎日日新聞 2018-07-27T01:20:29+09:00
title //div[contains(@class,'item_title')]/h3 exampleUrl http://www.the-miyanichi.co.jp/special/dreamNews/detailep.php?id=0000178118 url ^https?://www\.the-miyanichi\.co\.jp/.*/ author tag pageElement //div[contains(@class,'item_body')]/*[not(self::h3[contains(@class,'cat_title')]) and not(self::p[contains(@class,'bizTime')]) and not(self::div[contains(@class,'item')]) and not(self::div[contains(@class,'date')]) and not(self::div[contains(@class,'ad_right')])] subtitle firstPageLink nextLink memo last update: 2018-07-27T01:20:29+09:00