すべてのアトリビュートのアンカータグの正規表現

私は、リンクの値のテキスト文字列からすべてのリンクを置き換える正規表現を取得しようとしています。

リンクは次のようになります。

the link
the link

I want a regular expression that I get: the link

ありがとうございました、

ご挨拶

6
追加された 著者 Timo Huovinen,

5 答え

/]*>([^<]+)<\/a>/g

完璧ではありませんが、正確な一致と不一致の例をさらに提供する必要があります(例:空白はどうですか?)

19
追加された
あなたの例を使ったパターンの例を以下に示します: regexr.com?2vu1u
追加された 著者 Florian Peschka,
こんにちはフロリアン、他の例: リンク " rel = "nofollow noreferrer"> domain.com "> のリンク
追加された 著者 Lobo,
/]+)>((?:.(?!\<\/a\>))*.)<\/a>/g

This one will match any ... tag including correctly matching ones that contain a < or any full tags such as:

blah blah This line contains an HTML opening < bracket. blah blah
blah blah This line contains bold text. blah blah

キャプチャする:

This line contains an HTML opening < bracket.
  • with capture groups:
    • href="test.html"
    • This line contains an HTML opening < bracket.

そして

This line contains bold text.
  • with capture groups:
    • href="test.html"
    • This line contains bold text.

It also includes capturing groups for the tag attributes (like class="", href="", etc) そして contain (what is between the tag) that can be removed if you do not need them.

複数の行にまたがってキャプチャする場合は、最後に "g"フラグの前後に "s"を追加します。 "s"フラグは、正規表現のすべてのフレーバで機能しないことに注意してください。

Capture example (not using the "s" flag - not supported by regexr yet): http://regexr.com/39rsv

10
追加された
良い質問、@ジェリー。あなたの質問に答える方法は本当に分かりません(この投稿は1年以上遅れています)。しかし、XML特殊文字を含むHTML属性は何らかの形でエンコードされているはずです。
追加された 著者 idungotnosn,
最後にエスケープされていないスラッシュがあります
追加された 著者 Brian Leishman,
良いキャッチ@BrianLeishman、ありがとう!
追加された 著者 Jim,
あなたは bla bla yikes をカバーするためにこれをどのように修正しますか?それが私を今殺している人です。
追加された 著者 Jerry,

Just a little correction from the accepted answer. This is the correct regex: /]*>([^<]+)<\/a>/g. The forward slash (/) for closing the anchor tag was not escaped so no match will be made.

2
追加された

このようなもので十分でしょう


1
追加された

この100%の仕事を試してみてください

(?i)

1
追加された