求一段Flask(SQLAlchemy)的代码优化,关于在一个循环里重复select的 .

#计算7天内销量,并把每件商品的不同尺码库存分别显示 day7=today-datetime.timedeltadays=7 logs7=db.session.execute"SELECT product_name,goods_id,sumnumber as sellsum FROM sdb_sell_logs where createtime>:createtime group by goods_id order by sumnumber desc limit 0,20",{"createtime":datetime_timestampday7.strftime"%Y-%m-%d 00:00:00"}.fetchall goods_store7={} for item in logs7: store=db.session.execute"SELECT pdt_desc,store from sdb_products where goods_id=:goods_id",{"goods_id":item.goods_id}.fetchall item_store=[] for store_item in store: item_store.append[store_item.pdt_desc,store_item.store] goods_store7[item.goods_id]=item_store

这段代码要怎么优化请问?

感觉这个for item in logs7:的循环里要处理N次的select效率好低下。

你可以这样处理,做成一个查询(空间换取时间)

product_name, goods_idA, sumnumber, pdt_descA, storeA
product_name, goods_idA, sumnumber, pdt_descB, storeB
product_name, goods_idA, sumnumber, pdt_descC, storeC
product_name, goods_idB, sumnumber, pdt_descA, storeA
product_name, goods_idB, sumnumber, pdt_descB, storeB
product_name, goods_idB, sumnumber, pdt_descC, storeC

两个SQL做个连接,剩下的就是输出时去控制成你想要的结构就好了。

相比程序里面的数据结构操作, 数据库操作永远是heavy的

如果你的内存足够大, 那么可以考虑将7天的raw data全部select到内存里, 然后做各种操作.

在内存不够的时候比如现在的情况改成6个月, 你可以将数据分批输出SELECT LIMIT, 在内存里建立好表的模型, 进行累加的处理比如读到一条记录是红色裙子, 某月某日出售, 就是哪天的红裙子数量++
这时候充分利用python的字典结构吧, 千万别去定义class

总之, 不要使用数据库来计算, 而是使用代码在内存中计算.

另外, 在架构构中, 这些数据往往不需要在网页中计算, 你可以将这个程序做成一个定时的任务, 过去7天的报表, 每天跑一次或者每周跑一次, 然后直接生成一个html文件, 甚至结果直接email出去, 看需求了.

发表评论

电子邮件地址不会被公开。 必填项已用*标注