あなたがこれを言うとき:
table = page.css('table')
あなたはトップレベルのテーブルではなく、両方のテーブルをつかんでいます。したがって、ドキュメントルートに戻って、moschのように最初のテーブルの行と一致するセレクタを使用するか、 table
を次のような外部テーブルのみに修正することができます。
table = page.css('table').first
trs = table.xpath('./tr')
これはHTMLの実際の構造に依存します:
table = page.xpath('/html/body/table')
trs = table.xpath('./tr')
またはおそらく table
(これはPhrogzに感謝します)のためのものです。
table = page.at('table')
table = page.at_css('table')
# or various other CSS and XPath incantations