方法1使用 BeautifulSoup推荐frombs4importBeautifulSoup htmlpHello bWorld/b! a href#Click/a/psoupBeautifulSoup(html,html.parser)textsoup.get_text()print(text)# Hello World! Click方法2使用正则表达式简单场景importre htmlpHello bWorld/b! a href#Click/a/ptextre.sub(r[^],,html)print(text)# Hello World! Click方法3使用 html.parser标准库fromhtml.parserimportHTMLParserclassMyHTMLParser(HTMLParser):def__init__(self):super().__init__()self.text[]defhandle_data(self,data):self.text.append(data)defget_text(self):return.join(self.text)htmlpHello bWorld/b!/pparserMyHTMLParser()parser.feed(html)print(parser.get_text())# Hello World!方法4使用 lxml性能最好fromlxmlimporthtml html_strpHello bWorld/b!/ptreehtml.fromstring(html_str)texttree.text_content()print(text)# Hello World! 对比方法优点缺点BeautifulSoup简单易用容错强需要安装第三方库正则无需安装速度快复杂HTML可能出错html.parser标准库无需安装代码稍多lxml速度最快功能强大需要安装C库推荐一般用BeautifulSoup简单场景用正则。pipinstallbeautifulsoup4 lxml