wedata

Database: ことせかいWebページ読み込み用情報

Item Details: Over The Rainbow ~にじの彼方~

url ^https://nijikana\.net/index.php/page/[^/]+
pageElement //div[@id='container']/div[@id='content' and not(child::h3[text()='目次'])]/*[not(self::h2) and not(self::p[contains(child::a/text(),'トップページ')]) and not(@id='clap') and not(@id='continue') and not(@id='page_link') and not(@id='comment_form') and not(@id='vote')]|//section[not(@id) and not(child::h2[text()='目次'])]/article/*[not(self::h1) and not(@id='vote') and not(child::form)]
nextLink //div[@id='content' and not(child::ul//li/a[contains(@href,'/page/')])]//div[@id='page_link']//li[@class='next']/a[contains(@href,'/page/')]|//section[not(child::h2[contains(text(),'目次')])]/ul[@class='menu']/li/a[contains(@href,'/page/') and contains(text(),'次:')]
title //div[@id='content']/p/a[contains(@href,'/page/') and position()=last()]|//section[not(child::h2[contains(text(),'目次')])]/ul[@class='menu']/li[position()=1]/a[contains(@href,'/page/')]
subtitle //div[@id='content']/h2|//section/article/h1
firstPageLink //div[@id='content']/ul//li/a[contains(@href,'/page/')]|//section[child::h2[contains(text(),'目次')]]/ul[@class='menu']/li[child::a[contains(@href,'/page/')] and position()=1]/a
exampleUrl https://nijikana.net/index.php/page/kamishiro_other_osaka https://nijikana.net/index.php/page/kamishiro_other_osaka01
memo このサイトは似たようなURLで小説本文と本文へのリンクが記述されている場合があり、さらに、本文へのリンクのページへのリンクが記述されたページがあり、さらにその上のリンクのページへのリンクのページなどもあって、かなりややこしいです。また、個々のページのDOM構造が統一されていないようで、少なくとも二種類のDOM構造を確認しています。具体的には、 https://nijikana.net/index.php/page/kamishiro_other_osaka01 のDOM構造と https://nijikana.net/index.php/page/kamishiro_other_18_01 のDOM構造は違っていて、片方は //div[@class='novel_view'] はあるけれど、もう片方にはありません。また、このサイトはスマートフォン等へのDOM構造ももっているため、それへの対応も必要になります。

History

Back