我有原始的html,里面有一些css类用于各种标签.
例:
输入:
Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.
我想得到简单的HTML:
输出:
Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.
我不知道这些类的名字.我需要在JavaScript(node.js)中执行此操作.
任何的想法?
正如我在评论中指出的那样,这可以通过Cheerio来完成.
要删除所有元素的所有属性,您需要执行以下操作:
var html = '<p class="opener" itemprop="description">Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.</p>'; var $ = cheerio.load(html); // load the HTML $('*').each(function() { // iterate over all elements this.attribs = {}; // remove all attributes }); var html = $.html(); // get the HTML back