python – AssertionError:col应该是Column

如何在PySpark中创建一个新列并使用今天的日期填充此列?

这是我试过的:

import datetime
now = datetime.datetime.now()
df = df.withColumn("date",str(now)[:10])

我收到此错误:

AssertionError: col should be Column

解决方法

How to create a new column in PySpark and fill this column with the date of today?

已有功能:

from pyspark.sql.functions import current_date

df.withColumn("date",current_date().cast("string"))

AssertionError: col should be Column

使用文字

from pyspark.sql.functions import lit

df.withColumn("date",lit(str(now)[:10]))

dawei

【声明】:淮南站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。