PythonでHTMLタグを除去する方法

Pythonで文字列からタグを除去するには、正規表現を使って以下のようにすればできます。

例)

import re
p = re.compile(r"<[^>]*?>")
tag_str = "<div>hogefugafuga</p></div>"
p.sub("", tag_str)  # Return hogefugafuga

OR

```
import re
tag_str = "<div>hogefugafuga

</div>"
re.sub("r'<[^>]*?>'", "", tag_str) # Return hogefugafuga

<pre><code><br /><p>また、Djangoが用意しているユーティリティモジュールを使ってもできます。

</code></pre>

from django.utils import html
tag_str = "

<div>hogefugafuga</p></div>

<p>"
html.strip_tags(tag_str) # Return hogefugafuga
```

この記事が役に立った場合、シェアしていただけると励みになります!!