python - 如何在scrapy中实现嵌套项？

我正在抓取一些具有复杂分层信息的数据，需要将结果导出到 json。

我将项目定义为

class FamilyItem():
    name = Field()
    sons = Field()

class SonsItem():
    name = Field()
    grandsons = Field()

class GrandsonsItem():
    name = Field()
    age = Field()
    weight = Field()
    sex = Field()

当蜘蛛运行完成时，我会得到一个打印的项目输出，如

{'name': 'Jenny',
   'sons': [
            {'name': u'S1',
             'grandsons': [
                   {'name': u'GS1',
                    'age': 18,
                    'weight': 50
                   },
                   {
                    'name':u'GS2',
                    'age': 19,
                    'weight':51}]
                   }]
}

但是当我运行 scrapy crawl myscaper -o a.json 时，它总是说结果“不是 JSON 可序列化的”。然后我将项目输出复制并粘贴到 ipython 控制台并使用 json.dumps()，它工作正常。那么问题出在哪里？这让我发疯了......

最佳答案

保存嵌套项时，请确保将它们包装在对 dict() 的调用中，例如:

gs1 = GrandsonsItem()
gs1['name'] = 'GS1'
gs1['age'] = 18
gs1['weight'] = 50

gs2 = GrandsonsItem()
gs2['name'] = 'GS2'
gs2['age'] = 19
gs2['weight'] = 51

s1 = SonsItem()
s1['name'] = 'S1'
s1['grandsons'] = [dict(gs1), dict(gs2)]

jenny = FamilyItem()
jenny['name'] = 'Jenny'
jenny['sons'] = [dict(s1)]

https://stackoverflow.com/questions/11184557/

相关文章：

javascript - 日历结束日期错了一天

json - Jackson JsonTypeInfo.As.EXTERNAL_PROPERTY 无

mysql - 如何在 MySQL 中编写可以解析列中 JSON 数据的查询？

c# - 类型是接口(interface)或抽象类，不能实例化

bash - jq 直接替换文件上的文本(如 sed -i)

android - 对等通信选项

json - 遍历 JSON 文件 PowerShell

json - HATEOAS中 "_embedded"的含义及用法

json - meteor `Deps.autorun` 与 `Collection.observ

javascript - 如何使用 Angular-Translate 显示翻译？