beautifulsoup _ 星耀云

精选推荐

Python网页结构分析主要依…

CSS伪类选择器本身不触发重排…

XPath 中选择注释节点用 …

2026年2月25日

Sublime Text 本身不带 XML 格式化功能，XML Tidy 插件已多年未维护，直接装上大概率报错或根本没反应。

2026年2月22日

本文详解如何利用 beautifulsoup 定位 “ 标签并获取其后紧跟的纯文本内容，从而可靠地将嵌套 html 中的项目（如 car、bike、bus、train）提取为 python 字符串列表。

2026年1月8日

XPath 中选择注释节点用 comment()，它是一个节点测试（node test），专门匹配 XML 或 HTML 文档中的注释节点（即内容）。

2026年1月8日

CSS伪类选择器本身不触发重排（reflow），但滥用或搭配不当的样式属性会显著拖慢渲染性能——尤其在大量元素上使用 :hover、:focus-within 或复杂 :nth-child() 时。

2026年1月6日

Python网页结构分析主要依赖DOM（文档对象模型）解析，核心是把HTML或XML文本转换成树状结构，方便程序定位、提取和修改元素。关键不在于“爬”得多快，而在于“找”得准、取得稳。

2025年12月14日

Python爬虫核心是理解网站结构、发送请求、解析HTML、提取数据并保存；需注意反爬机制，常用request […]