PHPのフィードを介してウェブサイトの完全なコンテンツを抽出する

私はフィードを介してウェブサイトのニュースや投稿の完全な内容を取得したい。多くのウェブサイトではニュースや投稿の一部しかフィードに表示されません。
もちろん、私はそれを介してウェブサイトのコンテンツを取得するために開発された SimplePie というスクリプトが存在することを知っていますフィード。このスクリプトはニュースの完全な内容を取得しません。
もちろん、それを行う フルテキストフィード というスクリプトが見つかりました。それは自由ではありません。私は無料のスクリプトが必要です。
私の必要性を満たすための同様のスクリプトや方法をご存知ですか?

2

3 答え

Five Filtersのコンテンツ抽出の背後にあるコードは、実際にはオープンソースであり、可読性の元のJavascriptに基づいていますサービス)。

あなたはこれを次のように使うことができるはずです:

$page = file_get_contents($item_url);
$readability = new Readability($page);
if ($result = $readability->init()) {
    $content = $readability->getContent()->innerHTML;
}
9
追加された
@ RyanMcCue、それは魅力のように動作します:)
追加された 著者 lokeshpahal,
@drtanz彼らは自分のサイトを再構築したように見えることを修正しました。
追加された 著者 Ryan McCue,
@RyanMcQueリンクが動作しない、代替リンク?
追加された 著者 urok93,

http://magpierss.sourceforge.net/cookbook.shtml (無料)を使用できます。

RSSフィードを取得します。ウェブ上でそれを行う多くの多くのPHPスクリプトがあります... Googleあなたの友人!! :)

2
追加された
はい、そうです。Navarr
追加された 著者 A.B.Developer,
Ahmadは無料のスクリプトを探しています。このスクリプトはフィードを取り出し、フィードの抜粋だけではなく、ニュース項目の完全な内容を取得します
追加された 著者 Navarr,

あなたがここで何をしようとしているのかは完全には分かっていませんが、

$full_page_content = file_get_contents('http://www.example.com/');

編集:私はあなたを理解する場合は、[OK]を、あなたはこのような何かをする必要があります:

Get rss feed
Use SimplePie or something like it to go through each feed item
For each item in RSS feed
  Get the item's url
  Get the content from that URL
  Strip out the HTML/extract only the text you need
Combine all of these into a new RSS feed and send that to the user

注:これは簡単なことではありません。 Full-Text RSSがその製品に課金できる理由があります。

0
追加された
OPは基本的に上記のフルテキストフィードの無料版を望んでいます。
追加された 著者 Navarr,
PHP - 日本のコミュニティ [ja]
PHP - 日本のコミュニティ [ja]
4 参加者の

このグループではPHPについて話します。 パートナー:kotaeta.com