{
"cells": [
{
"cell_type": "markdown",
"id": "b0c0ae08-2fb5-47f5-a5ce-1a66e35791a4",
"metadata": {},
"source": [
"### Cleaning Data"
]
},
{
"cell_type": "code",
"execution_count": 1,
"id": "f9998a78-ae01-4531-b325-637b6d5ee86d",
"metadata": {},
"outputs": [],
"source": [
"import pandas as pd"
]
},
{
"cell_type": "code",
"execution_count": 2,
"id": "9516a86a-ed6a-4f79-b631-3195daec258c",
"metadata": {},
"outputs": [],
"source": [
"df = pd.read_csv('https://gist.githubusercontent.com/maltegrosse/bdfd2c6a5e3bff315d92cd27c2461a48/raw/49d5672953360934601b3d252c9b78121eed10db/data.csv')"
]
},
{
"cell_type": "code",
"execution_count": 3,
"id": "ea25a32c-70d3-479d-8d11-7e487f13f50c",
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"
\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Duration | \n",
" Date | \n",
" Pulse | \n",
" Maxpulse | \n",
" Calories | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 60 | \n",
" '2020/12/01' | \n",
" 110 | \n",
" 130 | \n",
" 409.1 | \n",
"
\n",
" \n",
" 1 | \n",
" 60 | \n",
" '2020/12/02' | \n",
" 117 | \n",
" 145 | \n",
" 479.0 | \n",
"
\n",
" \n",
" 2 | \n",
" 60 | \n",
" '2020/12/03' | \n",
" 103 | \n",
" 135 | \n",
" 340.0 | \n",
"
\n",
" \n",
" 3 | \n",
" 45 | \n",
" '2020/12/04' | \n",
" 109 | \n",
" 175 | \n",
" 282.4 | \n",
"
\n",
" \n",
" 4 | \n",
" 45 | \n",
" '2020/12/05' | \n",
" 117 | \n",
" 148 | \n",
" 406.0 | \n",
"
\n",
" \n",
" 5 | \n",
" 60 | \n",
" '2020/12/06' | \n",
" 102 | \n",
" 127 | \n",
" 300.0 | \n",
"
\n",
" \n",
" 6 | \n",
" 60 | \n",
" '2020/12/07' | \n",
" 110 | \n",
" 136 | \n",
" 374.0 | \n",
"
\n",
" \n",
" 7 | \n",
" 450 | \n",
" '2020/12/08' | \n",
" 104 | \n",
" 134 | \n",
" 253.3 | \n",
"
\n",
" \n",
" 8 | \n",
" 30 | \n",
" '2020/12/09' | \n",
" 109 | \n",
" 133 | \n",
" 195.1 | \n",
"
\n",
" \n",
" 9 | \n",
" 60 | \n",
" '2020/12/10' | \n",
" 98 | \n",
" 124 | \n",
" 269.0 | \n",
"
\n",
" \n",
" 10 | \n",
" 60 | \n",
" '2020/12/11' | \n",
" 103 | \n",
" 147 | \n",
" 329.3 | \n",
"
\n",
" \n",
" 11 | \n",
" 60 | \n",
" '2020/12/12' | \n",
" 100 | \n",
" 120 | \n",
" 250.7 | \n",
"
\n",
" \n",
" 12 | \n",
" 60 | \n",
" '2020/12/12' | \n",
" 100 | \n",
" 120 | \n",
" 250.7 | \n",
"
\n",
" \n",
" 13 | \n",
" 60 | \n",
" '2020/12/13' | \n",
" 106 | \n",
" 128 | \n",
" 345.3 | \n",
"
\n",
" \n",
" 14 | \n",
" 60 | \n",
" '2020/12/14' | \n",
" 104 | \n",
" 132 | \n",
" 379.3 | \n",
"
\n",
" \n",
" 15 | \n",
" 60 | \n",
" '2020/12/15' | \n",
" 98 | \n",
" 123 | \n",
" 275.0 | \n",
"
\n",
" \n",
" 16 | \n",
" 60 | \n",
" '2020/12/16' | \n",
" 98 | \n",
" 120 | \n",
" 215.2 | \n",
"
\n",
" \n",
" 17 | \n",
" 60 | \n",
" '2020/12/17' | \n",
" 100 | \n",
" 120 | \n",
" 300.0 | \n",
"
\n",
" \n",
" 18 | \n",
" 45 | \n",
" '2020/12/18' | \n",
" 90 | \n",
" 112 | \n",
" NaN | \n",
"
\n",
" \n",
" 19 | \n",
" 60 | \n",
" '2020/12/19' | \n",
" 103 | \n",
" 123 | \n",
" 323.0 | \n",
"
\n",
" \n",
" 20 | \n",
" 45 | \n",
" '2020/12/20' | \n",
" 97 | \n",
" 125 | \n",
" 243.0 | \n",
"
\n",
" \n",
" 21 | \n",
" 60 | \n",
" '2020/12/21' | \n",
" 108 | \n",
" 131 | \n",
" 364.2 | \n",
"
\n",
" \n",
" 22 | \n",
" 45 | \n",
" NaN | \n",
" 100 | \n",
" 119 | \n",
" 282.0 | \n",
"
\n",
" \n",
" 23 | \n",
" 60 | \n",
" '2020/12/23' | \n",
" 130 | \n",
" 101 | \n",
" 300.0 | \n",
"
\n",
" \n",
" 24 | \n",
" 45 | \n",
" '2020/12/24' | \n",
" 105 | \n",
" 132 | \n",
" 246.0 | \n",
"
\n",
" \n",
" 25 | \n",
" 60 | \n",
" '2020/12/25' | \n",
" 102 | \n",
" 126 | \n",
" 334.5 | \n",
"
\n",
" \n",
" 26 | \n",
" 60 | \n",
" 20201226 | \n",
" 100 | \n",
" 120 | \n",
" 250.0 | \n",
"
\n",
" \n",
" 27 | \n",
" 60 | \n",
" '2020/12/27' | \n",
" 92 | \n",
" 118 | \n",
" 241.0 | \n",
"
\n",
" \n",
" 28 | \n",
" 60 | \n",
" '2020/12/28' | \n",
" 103 | \n",
" 132 | \n",
" NaN | \n",
"
\n",
" \n",
" 29 | \n",
" 60 | \n",
" '2020/12/29' | \n",
" 100 | \n",
" 132 | \n",
" 280.0 | \n",
"
\n",
" \n",
" 30 | \n",
" 60 | \n",
" '2020/12/30' | \n",
" 102 | \n",
" 129 | \n",
" 380.3 | \n",
"
\n",
" \n",
" 31 | \n",
" 60 | \n",
" '2020/12/31' | \n",
" 92 | \n",
" 115 | \n",
" 243.0 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Duration Date Pulse Maxpulse Calories\n",
"0 60 '2020/12/01' 110 130 409.1\n",
"1 60 '2020/12/02' 117 145 479.0\n",
"2 60 '2020/12/03' 103 135 340.0\n",
"3 45 '2020/12/04' 109 175 282.4\n",
"4 45 '2020/12/05' 117 148 406.0\n",
"5 60 '2020/12/06' 102 127 300.0\n",
"6 60 '2020/12/07' 110 136 374.0\n",
"7 450 '2020/12/08' 104 134 253.3\n",
"8 30 '2020/12/09' 109 133 195.1\n",
"9 60 '2020/12/10' 98 124 269.0\n",
"10 60 '2020/12/11' 103 147 329.3\n",
"11 60 '2020/12/12' 100 120 250.7\n",
"12 60 '2020/12/12' 100 120 250.7\n",
"13 60 '2020/12/13' 106 128 345.3\n",
"14 60 '2020/12/14' 104 132 379.3\n",
"15 60 '2020/12/15' 98 123 275.0\n",
"16 60 '2020/12/16' 98 120 215.2\n",
"17 60 '2020/12/17' 100 120 300.0\n",
"18 45 '2020/12/18' 90 112 NaN\n",
"19 60 '2020/12/19' 103 123 323.0\n",
"20 45 '2020/12/20' 97 125 243.0\n",
"21 60 '2020/12/21' 108 131 364.2\n",
"22 45 NaN 100 119 282.0\n",
"23 60 '2020/12/23' 130 101 300.0\n",
"24 45 '2020/12/24' 105 132 246.0\n",
"25 60 '2020/12/25' 102 126 334.5\n",
"26 60 20201226 100 120 250.0\n",
"27 60 '2020/12/27' 92 118 241.0\n",
"28 60 '2020/12/28' 103 132 NaN\n",
"29 60 '2020/12/29' 100 132 280.0\n",
"30 60 '2020/12/30' 102 129 380.3\n",
"31 60 '2020/12/31' 92 115 243.0"
]
},
"execution_count": 3,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df"
]
},
{
"cell_type": "code",
"execution_count": 4,
"id": "2baf29d8-cd8f-4dfd-931a-c413a995320e",
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Duration | \n",
" Date | \n",
" Pulse | \n",
" Maxpulse | \n",
" Calories | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 60 | \n",
" '2020/12/01' | \n",
" 110 | \n",
" 130 | \n",
" 409.1 | \n",
"
\n",
" \n",
" 1 | \n",
" 60 | \n",
" '2020/12/02' | \n",
" 117 | \n",
" 145 | \n",
" 479.0 | \n",
"
\n",
" \n",
" 2 | \n",
" 60 | \n",
" '2020/12/03' | \n",
" 103 | \n",
" 135 | \n",
" 340.0 | \n",
"
\n",
" \n",
" 3 | \n",
" 45 | \n",
" '2020/12/04' | \n",
" 109 | \n",
" 175 | \n",
" 282.4 | \n",
"
\n",
" \n",
" 4 | \n",
" 45 | \n",
" '2020/12/05' | \n",
" 117 | \n",
" 148 | \n",
" 406.0 | \n",
"
\n",
" \n",
" 5 | \n",
" 60 | \n",
" '2020/12/06' | \n",
" 102 | \n",
" 127 | \n",
" 300.0 | \n",
"
\n",
" \n",
" 6 | \n",
" 60 | \n",
" '2020/12/07' | \n",
" 110 | \n",
" 136 | \n",
" 374.0 | \n",
"
\n",
" \n",
" 7 | \n",
" 450 | \n",
" '2020/12/08' | \n",
" 104 | \n",
" 134 | \n",
" 253.3 | \n",
"
\n",
" \n",
" 8 | \n",
" 30 | \n",
" '2020/12/09' | \n",
" 109 | \n",
" 133 | \n",
" 195.1 | \n",
"
\n",
" \n",
" 9 | \n",
" 60 | \n",
" '2020/12/10' | \n",
" 98 | \n",
" 124 | \n",
" 269.0 | \n",
"
\n",
" \n",
" 10 | \n",
" 60 | \n",
" '2020/12/11' | \n",
" 103 | \n",
" 147 | \n",
" 329.3 | \n",
"
\n",
" \n",
" 11 | \n",
" 60 | \n",
" '2020/12/12' | \n",
" 100 | \n",
" 120 | \n",
" 250.7 | \n",
"
\n",
" \n",
" 12 | \n",
" 60 | \n",
" '2020/12/12' | \n",
" 100 | \n",
" 120 | \n",
" 250.7 | \n",
"
\n",
" \n",
" 13 | \n",
" 60 | \n",
" '2020/12/13' | \n",
" 106 | \n",
" 128 | \n",
" 345.3 | \n",
"
\n",
" \n",
" 14 | \n",
" 60 | \n",
" '2020/12/14' | \n",
" 104 | \n",
" 132 | \n",
" 379.3 | \n",
"
\n",
" \n",
" 15 | \n",
" 60 | \n",
" '2020/12/15' | \n",
" 98 | \n",
" 123 | \n",
" 275.0 | \n",
"
\n",
" \n",
" 16 | \n",
" 60 | \n",
" '2020/12/16' | \n",
" 98 | \n",
" 120 | \n",
" 215.2 | \n",
"
\n",
" \n",
" 17 | \n",
" 60 | \n",
" '2020/12/17' | \n",
" 100 | \n",
" 120 | \n",
" 300.0 | \n",
"
\n",
" \n",
" 19 | \n",
" 60 | \n",
" '2020/12/19' | \n",
" 103 | \n",
" 123 | \n",
" 323.0 | \n",
"
\n",
" \n",
" 20 | \n",
" 45 | \n",
" '2020/12/20' | \n",
" 97 | \n",
" 125 | \n",
" 243.0 | \n",
"
\n",
" \n",
" 21 | \n",
" 60 | \n",
" '2020/12/21' | \n",
" 108 | \n",
" 131 | \n",
" 364.2 | \n",
"
\n",
" \n",
" 23 | \n",
" 60 | \n",
" '2020/12/23' | \n",
" 130 | \n",
" 101 | \n",
" 300.0 | \n",
"
\n",
" \n",
" 24 | \n",
" 45 | \n",
" '2020/12/24' | \n",
" 105 | \n",
" 132 | \n",
" 246.0 | \n",
"
\n",
" \n",
" 25 | \n",
" 60 | \n",
" '2020/12/25' | \n",
" 102 | \n",
" 126 | \n",
" 334.5 | \n",
"
\n",
" \n",
" 26 | \n",
" 60 | \n",
" 20201226 | \n",
" 100 | \n",
" 120 | \n",
" 250.0 | \n",
"
\n",
" \n",
" 27 | \n",
" 60 | \n",
" '2020/12/27' | \n",
" 92 | \n",
" 118 | \n",
" 241.0 | \n",
"
\n",
" \n",
" 29 | \n",
" 60 | \n",
" '2020/12/29' | \n",
" 100 | \n",
" 132 | \n",
" 280.0 | \n",
"
\n",
" \n",
" 30 | \n",
" 60 | \n",
" '2020/12/30' | \n",
" 102 | \n",
" 129 | \n",
" 380.3 | \n",
"
\n",
" \n",
" 31 | \n",
" 60 | \n",
" '2020/12/31' | \n",
" 92 | \n",
" 115 | \n",
" 243.0 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Duration Date Pulse Maxpulse Calories\n",
"0 60 '2020/12/01' 110 130 409.1\n",
"1 60 '2020/12/02' 117 145 479.0\n",
"2 60 '2020/12/03' 103 135 340.0\n",
"3 45 '2020/12/04' 109 175 282.4\n",
"4 45 '2020/12/05' 117 148 406.0\n",
"5 60 '2020/12/06' 102 127 300.0\n",
"6 60 '2020/12/07' 110 136 374.0\n",
"7 450 '2020/12/08' 104 134 253.3\n",
"8 30 '2020/12/09' 109 133 195.1\n",
"9 60 '2020/12/10' 98 124 269.0\n",
"10 60 '2020/12/11' 103 147 329.3\n",
"11 60 '2020/12/12' 100 120 250.7\n",
"12 60 '2020/12/12' 100 120 250.7\n",
"13 60 '2020/12/13' 106 128 345.3\n",
"14 60 '2020/12/14' 104 132 379.3\n",
"15 60 '2020/12/15' 98 123 275.0\n",
"16 60 '2020/12/16' 98 120 215.2\n",
"17 60 '2020/12/17' 100 120 300.0\n",
"19 60 '2020/12/19' 103 123 323.0\n",
"20 45 '2020/12/20' 97 125 243.0\n",
"21 60 '2020/12/21' 108 131 364.2\n",
"23 60 '2020/12/23' 130 101 300.0\n",
"24 45 '2020/12/24' 105 132 246.0\n",
"25 60 '2020/12/25' 102 126 334.5\n",
"26 60 20201226 100 120 250.0\n",
"27 60 '2020/12/27' 92 118 241.0\n",
"29 60 '2020/12/29' 100 132 280.0\n",
"30 60 '2020/12/30' 102 129 380.3\n",
"31 60 '2020/12/31' 92 115 243.0"
]
},
"execution_count": 4,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# drop null/NaN\n",
"new_df = df.dropna()\n",
"new_df"
]
},
{
"cell_type": "code",
"execution_count": 5,
"id": "37533007-2851-49da-8fca-2e9d3b74c406",
"metadata": {},
"outputs": [],
"source": [
"# hint df.dropna(inplace = True) <- manipulates orginal df"
]
},
{
"cell_type": "code",
"execution_count": 6,
"id": "e94f0608-1928-4dec-b28c-3f56d72b1867",
"metadata": {},
"outputs": [],
"source": [
"# fill missing values\n",
"# df.fillna(130, inplace = True)"
]
},
{
"cell_type": "code",
"execution_count": 9,
"id": "025cec14-2687-4ec5-9fa9-f10f1da927ea",
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Duration | \n",
" Date | \n",
" Pulse | \n",
" Maxpulse | \n",
" Calories | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 60 | \n",
" '2020/12/01' | \n",
" 110 | \n",
" 130 | \n",
" 409.10 | \n",
"
\n",
" \n",
" 1 | \n",
" 60 | \n",
" '2020/12/02' | \n",
" 117 | \n",
" 145 | \n",
" 479.00 | \n",
"
\n",
" \n",
" 2 | \n",
" 60 | \n",
" '2020/12/03' | \n",
" 103 | \n",
" 135 | \n",
" 340.00 | \n",
"
\n",
" \n",
" 3 | \n",
" 45 | \n",
" '2020/12/04' | \n",
" 109 | \n",
" 175 | \n",
" 282.40 | \n",
"
\n",
" \n",
" 4 | \n",
" 45 | \n",
" '2020/12/05' | \n",
" 117 | \n",
" 148 | \n",
" 406.00 | \n",
"
\n",
" \n",
" 5 | \n",
" 60 | \n",
" '2020/12/06' | \n",
" 102 | \n",
" 127 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 6 | \n",
" 60 | \n",
" '2020/12/07' | \n",
" 110 | \n",
" 136 | \n",
" 374.00 | \n",
"
\n",
" \n",
" 7 | \n",
" 450 | \n",
" '2020/12/08' | \n",
" 104 | \n",
" 134 | \n",
" 253.30 | \n",
"
\n",
" \n",
" 8 | \n",
" 30 | \n",
" '2020/12/09' | \n",
" 109 | \n",
" 133 | \n",
" 195.10 | \n",
"
\n",
" \n",
" 9 | \n",
" 60 | \n",
" '2020/12/10' | \n",
" 98 | \n",
" 124 | \n",
" 269.00 | \n",
"
\n",
" \n",
" 10 | \n",
" 60 | \n",
" '2020/12/11' | \n",
" 103 | \n",
" 147 | \n",
" 329.30 | \n",
"
\n",
" \n",
" 11 | \n",
" 60 | \n",
" '2020/12/12' | \n",
" 100 | \n",
" 120 | \n",
" 250.70 | \n",
"
\n",
" \n",
" 12 | \n",
" 60 | \n",
" '2020/12/12' | \n",
" 100 | \n",
" 120 | \n",
" 250.70 | \n",
"
\n",
" \n",
" 13 | \n",
" 60 | \n",
" '2020/12/13' | \n",
" 106 | \n",
" 128 | \n",
" 345.30 | \n",
"
\n",
" \n",
" 14 | \n",
" 60 | \n",
" '2020/12/14' | \n",
" 104 | \n",
" 132 | \n",
" 379.30 | \n",
"
\n",
" \n",
" 15 | \n",
" 60 | \n",
" '2020/12/15' | \n",
" 98 | \n",
" 123 | \n",
" 275.00 | \n",
"
\n",
" \n",
" 16 | \n",
" 60 | \n",
" '2020/12/16' | \n",
" 98 | \n",
" 120 | \n",
" 215.20 | \n",
"
\n",
" \n",
" 17 | \n",
" 60 | \n",
" '2020/12/17' | \n",
" 100 | \n",
" 120 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 18 | \n",
" 45 | \n",
" '2020/12/18' | \n",
" 90 | \n",
" 112 | \n",
" 304.68 | \n",
"
\n",
" \n",
" 19 | \n",
" 60 | \n",
" '2020/12/19' | \n",
" 103 | \n",
" 123 | \n",
" 323.00 | \n",
"
\n",
" \n",
" 20 | \n",
" 45 | \n",
" '2020/12/20' | \n",
" 97 | \n",
" 125 | \n",
" 243.00 | \n",
"
\n",
" \n",
" 21 | \n",
" 60 | \n",
" '2020/12/21' | \n",
" 108 | \n",
" 131 | \n",
" 364.20 | \n",
"
\n",
" \n",
" 22 | \n",
" 45 | \n",
" NaN | \n",
" 100 | \n",
" 119 | \n",
" 282.00 | \n",
"
\n",
" \n",
" 23 | \n",
" 60 | \n",
" '2020/12/23' | \n",
" 130 | \n",
" 101 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 24 | \n",
" 45 | \n",
" '2020/12/24' | \n",
" 105 | \n",
" 132 | \n",
" 246.00 | \n",
"
\n",
" \n",
" 25 | \n",
" 60 | \n",
" '2020/12/25' | \n",
" 102 | \n",
" 126 | \n",
" 334.50 | \n",
"
\n",
" \n",
" 26 | \n",
" 60 | \n",
" 20201226 | \n",
" 100 | \n",
" 120 | \n",
" 250.00 | \n",
"
\n",
" \n",
" 27 | \n",
" 60 | \n",
" '2020/12/27' | \n",
" 92 | \n",
" 118 | \n",
" 241.00 | \n",
"
\n",
" \n",
" 28 | \n",
" 60 | \n",
" '2020/12/28' | \n",
" 103 | \n",
" 132 | \n",
" 304.68 | \n",
"
\n",
" \n",
" 29 | \n",
" 60 | \n",
" '2020/12/29' | \n",
" 100 | \n",
" 132 | \n",
" 280.00 | \n",
"
\n",
" \n",
" 30 | \n",
" 60 | \n",
" '2020/12/30' | \n",
" 102 | \n",
" 129 | \n",
" 380.30 | \n",
"
\n",
" \n",
" 31 | \n",
" 60 | \n",
" '2020/12/31' | \n",
" 92 | \n",
" 115 | \n",
" 243.00 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Duration Date Pulse Maxpulse Calories\n",
"0 60 '2020/12/01' 110 130 409.10\n",
"1 60 '2020/12/02' 117 145 479.00\n",
"2 60 '2020/12/03' 103 135 340.00\n",
"3 45 '2020/12/04' 109 175 282.40\n",
"4 45 '2020/12/05' 117 148 406.00\n",
"5 60 '2020/12/06' 102 127 300.00\n",
"6 60 '2020/12/07' 110 136 374.00\n",
"7 450 '2020/12/08' 104 134 253.30\n",
"8 30 '2020/12/09' 109 133 195.10\n",
"9 60 '2020/12/10' 98 124 269.00\n",
"10 60 '2020/12/11' 103 147 329.30\n",
"11 60 '2020/12/12' 100 120 250.70\n",
"12 60 '2020/12/12' 100 120 250.70\n",
"13 60 '2020/12/13' 106 128 345.30\n",
"14 60 '2020/12/14' 104 132 379.30\n",
"15 60 '2020/12/15' 98 123 275.00\n",
"16 60 '2020/12/16' 98 120 215.20\n",
"17 60 '2020/12/17' 100 120 300.00\n",
"18 45 '2020/12/18' 90 112 304.68\n",
"19 60 '2020/12/19' 103 123 323.00\n",
"20 45 '2020/12/20' 97 125 243.00\n",
"21 60 '2020/12/21' 108 131 364.20\n",
"22 45 NaN 100 119 282.00\n",
"23 60 '2020/12/23' 130 101 300.00\n",
"24 45 '2020/12/24' 105 132 246.00\n",
"25 60 '2020/12/25' 102 126 334.50\n",
"26 60 20201226 100 120 250.00\n",
"27 60 '2020/12/27' 92 118 241.00\n",
"28 60 '2020/12/28' 103 132 304.68\n",
"29 60 '2020/12/29' 100 132 280.00\n",
"30 60 '2020/12/30' 102 129 380.30\n",
"31 60 '2020/12/31' 92 115 243.00"
]
},
"execution_count": 9,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"x = df[\"Calories\"].mean()\n",
"\n",
"df[\"Calories\"].fillna(x, inplace=True)\n",
"df"
]
},
{
"cell_type": "code",
"execution_count": 10,
"id": "d2e87f3b-ef58-4128-b52f-799056e56de8",
"metadata": {},
"outputs": [],
"source": [
"x = df[\"Calories\"].median()\n",
"\n",
"df[\"Calories\"].fillna(x, inplace = True)"
]
},
{
"cell_type": "code",
"execution_count": 12,
"id": "c42df786-aa1b-4174-b436-566421f1683b",
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Duration | \n",
" Date | \n",
" Pulse | \n",
" Maxpulse | \n",
" Calories | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 60 | \n",
" 2020-12-01 | \n",
" 110 | \n",
" 130 | \n",
" 409.10 | \n",
"
\n",
" \n",
" 1 | \n",
" 60 | \n",
" 2020-12-02 | \n",
" 117 | \n",
" 145 | \n",
" 479.00 | \n",
"
\n",
" \n",
" 2 | \n",
" 60 | \n",
" 2020-12-03 | \n",
" 103 | \n",
" 135 | \n",
" 340.00 | \n",
"
\n",
" \n",
" 3 | \n",
" 45 | \n",
" 2020-12-04 | \n",
" 109 | \n",
" 175 | \n",
" 282.40 | \n",
"
\n",
" \n",
" 4 | \n",
" 45 | \n",
" 2020-12-05 | \n",
" 117 | \n",
" 148 | \n",
" 406.00 | \n",
"
\n",
" \n",
" 5 | \n",
" 60 | \n",
" 2020-12-06 | \n",
" 102 | \n",
" 127 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 6 | \n",
" 60 | \n",
" 2020-12-07 | \n",
" 110 | \n",
" 136 | \n",
" 374.00 | \n",
"
\n",
" \n",
" 7 | \n",
" 450 | \n",
" 2020-12-08 | \n",
" 104 | \n",
" 134 | \n",
" 253.30 | \n",
"
\n",
" \n",
" 8 | \n",
" 30 | \n",
" 2020-12-09 | \n",
" 109 | \n",
" 133 | \n",
" 195.10 | \n",
"
\n",
" \n",
" 9 | \n",
" 60 | \n",
" 2020-12-10 | \n",
" 98 | \n",
" 124 | \n",
" 269.00 | \n",
"
\n",
" \n",
" 10 | \n",
" 60 | \n",
" 2020-12-11 | \n",
" 103 | \n",
" 147 | \n",
" 329.30 | \n",
"
\n",
" \n",
" 11 | \n",
" 60 | \n",
" 2020-12-12 | \n",
" 100 | \n",
" 120 | \n",
" 250.70 | \n",
"
\n",
" \n",
" 12 | \n",
" 60 | \n",
" 2020-12-12 | \n",
" 100 | \n",
" 120 | \n",
" 250.70 | \n",
"
\n",
" \n",
" 13 | \n",
" 60 | \n",
" 2020-12-13 | \n",
" 106 | \n",
" 128 | \n",
" 345.30 | \n",
"
\n",
" \n",
" 14 | \n",
" 60 | \n",
" 2020-12-14 | \n",
" 104 | \n",
" 132 | \n",
" 379.30 | \n",
"
\n",
" \n",
" 15 | \n",
" 60 | \n",
" 2020-12-15 | \n",
" 98 | \n",
" 123 | \n",
" 275.00 | \n",
"
\n",
" \n",
" 16 | \n",
" 60 | \n",
" 2020-12-16 | \n",
" 98 | \n",
" 120 | \n",
" 215.20 | \n",
"
\n",
" \n",
" 17 | \n",
" 60 | \n",
" 2020-12-17 | \n",
" 100 | \n",
" 120 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 18 | \n",
" 45 | \n",
" 2020-12-18 | \n",
" 90 | \n",
" 112 | \n",
" 304.68 | \n",
"
\n",
" \n",
" 19 | \n",
" 60 | \n",
" 2020-12-19 | \n",
" 103 | \n",
" 123 | \n",
" 323.00 | \n",
"
\n",
" \n",
" 20 | \n",
" 45 | \n",
" 2020-12-20 | \n",
" 97 | \n",
" 125 | \n",
" 243.00 | \n",
"
\n",
" \n",
" 21 | \n",
" 60 | \n",
" 2020-12-21 | \n",
" 108 | \n",
" 131 | \n",
" 364.20 | \n",
"
\n",
" \n",
" 22 | \n",
" 45 | \n",
" NaT | \n",
" 100 | \n",
" 119 | \n",
" 282.00 | \n",
"
\n",
" \n",
" 23 | \n",
" 60 | \n",
" 2020-12-23 | \n",
" 130 | \n",
" 101 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 24 | \n",
" 45 | \n",
" 2020-12-24 | \n",
" 105 | \n",
" 132 | \n",
" 246.00 | \n",
"
\n",
" \n",
" 25 | \n",
" 60 | \n",
" 2020-12-25 | \n",
" 102 | \n",
" 126 | \n",
" 334.50 | \n",
"
\n",
" \n",
" 26 | \n",
" 60 | \n",
" 2020-12-26 | \n",
" 100 | \n",
" 120 | \n",
" 250.00 | \n",
"
\n",
" \n",
" 27 | \n",
" 60 | \n",
" 2020-12-27 | \n",
" 92 | \n",
" 118 | \n",
" 241.00 | \n",
"
\n",
" \n",
" 28 | \n",
" 60 | \n",
" 2020-12-28 | \n",
" 103 | \n",
" 132 | \n",
" 304.68 | \n",
"
\n",
" \n",
" 29 | \n",
" 60 | \n",
" 2020-12-29 | \n",
" 100 | \n",
" 132 | \n",
" 280.00 | \n",
"
\n",
" \n",
" 30 | \n",
" 60 | \n",
" 2020-12-30 | \n",
" 102 | \n",
" 129 | \n",
" 380.30 | \n",
"
\n",
" \n",
" 31 | \n",
" 60 | \n",
" 2020-12-31 | \n",
" 92 | \n",
" 115 | \n",
" 243.00 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Duration Date Pulse Maxpulse Calories\n",
"0 60 2020-12-01 110 130 409.10\n",
"1 60 2020-12-02 117 145 479.00\n",
"2 60 2020-12-03 103 135 340.00\n",
"3 45 2020-12-04 109 175 282.40\n",
"4 45 2020-12-05 117 148 406.00\n",
"5 60 2020-12-06 102 127 300.00\n",
"6 60 2020-12-07 110 136 374.00\n",
"7 450 2020-12-08 104 134 253.30\n",
"8 30 2020-12-09 109 133 195.10\n",
"9 60 2020-12-10 98 124 269.00\n",
"10 60 2020-12-11 103 147 329.30\n",
"11 60 2020-12-12 100 120 250.70\n",
"12 60 2020-12-12 100 120 250.70\n",
"13 60 2020-12-13 106 128 345.30\n",
"14 60 2020-12-14 104 132 379.30\n",
"15 60 2020-12-15 98 123 275.00\n",
"16 60 2020-12-16 98 120 215.20\n",
"17 60 2020-12-17 100 120 300.00\n",
"18 45 2020-12-18 90 112 304.68\n",
"19 60 2020-12-19 103 123 323.00\n",
"20 45 2020-12-20 97 125 243.00\n",
"21 60 2020-12-21 108 131 364.20\n",
"22 45 NaT 100 119 282.00\n",
"23 60 2020-12-23 130 101 300.00\n",
"24 45 2020-12-24 105 132 246.00\n",
"25 60 2020-12-25 102 126 334.50\n",
"26 60 2020-12-26 100 120 250.00\n",
"27 60 2020-12-27 92 118 241.00\n",
"28 60 2020-12-28 103 132 304.68\n",
"29 60 2020-12-29 100 132 280.00\n",
"30 60 2020-12-30 102 129 380.30\n",
"31 60 2020-12-31 92 115 243.00"
]
},
"execution_count": 12,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# convert into proper data type\n",
"df['Date'] = pd.to_datetime(df['Date'])\n",
"df"
]
},
{
"cell_type": "code",
"execution_count": 13,
"id": "6508edc2-f7f1-469b-a094-1b6c98a155e3",
"metadata": {},
"outputs": [],
"source": [
"# remove missing value according to a column\n",
"# df.dropna(subset=['Date'], inplace = True)"
]
},
{
"cell_type": "markdown",
"id": "725032e8-c03e-428e-a928-f5c2533a3446",
"metadata": {},
"source": [
"#### Fixing Wrong Data"
]
},
{
"cell_type": "code",
"execution_count": 15,
"id": "3367d5c9-90f8-4fb1-9c2b-bae2bdaeb7bf",
"metadata": {},
"outputs": [],
"source": [
"# row 7: 450 duration!\n",
"df.loc[7, 'Duration'] = 45"
]
},
{
"cell_type": "code",
"execution_count": 16,
"id": "1a9ce891-9275-4539-a23c-4826fb258c1d",
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Duration | \n",
" Date | \n",
" Pulse | \n",
" Maxpulse | \n",
" Calories | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 60 | \n",
" 2020-12-01 | \n",
" 110 | \n",
" 130 | \n",
" 409.10 | \n",
"
\n",
" \n",
" 1 | \n",
" 60 | \n",
" 2020-12-02 | \n",
" 117 | \n",
" 145 | \n",
" 479.00 | \n",
"
\n",
" \n",
" 2 | \n",
" 60 | \n",
" 2020-12-03 | \n",
" 103 | \n",
" 135 | \n",
" 340.00 | \n",
"
\n",
" \n",
" 3 | \n",
" 45 | \n",
" 2020-12-04 | \n",
" 109 | \n",
" 175 | \n",
" 282.40 | \n",
"
\n",
" \n",
" 4 | \n",
" 45 | \n",
" 2020-12-05 | \n",
" 117 | \n",
" 148 | \n",
" 406.00 | \n",
"
\n",
" \n",
" 5 | \n",
" 60 | \n",
" 2020-12-06 | \n",
" 102 | \n",
" 127 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 6 | \n",
" 60 | \n",
" 2020-12-07 | \n",
" 110 | \n",
" 136 | \n",
" 374.00 | \n",
"
\n",
" \n",
" 7 | \n",
" 45 | \n",
" 2020-12-08 | \n",
" 104 | \n",
" 134 | \n",
" 253.30 | \n",
"
\n",
" \n",
" 8 | \n",
" 30 | \n",
" 2020-12-09 | \n",
" 109 | \n",
" 133 | \n",
" 195.10 | \n",
"
\n",
" \n",
" 9 | \n",
" 60 | \n",
" 2020-12-10 | \n",
" 98 | \n",
" 124 | \n",
" 269.00 | \n",
"
\n",
" \n",
" 10 | \n",
" 60 | \n",
" 2020-12-11 | \n",
" 103 | \n",
" 147 | \n",
" 329.30 | \n",
"
\n",
" \n",
" 11 | \n",
" 60 | \n",
" 2020-12-12 | \n",
" 100 | \n",
" 120 | \n",
" 250.70 | \n",
"
\n",
" \n",
" 12 | \n",
" 60 | \n",
" 2020-12-12 | \n",
" 100 | \n",
" 120 | \n",
" 250.70 | \n",
"
\n",
" \n",
" 13 | \n",
" 60 | \n",
" 2020-12-13 | \n",
" 106 | \n",
" 128 | \n",
" 345.30 | \n",
"
\n",
" \n",
" 14 | \n",
" 60 | \n",
" 2020-12-14 | \n",
" 104 | \n",
" 132 | \n",
" 379.30 | \n",
"
\n",
" \n",
" 15 | \n",
" 60 | \n",
" 2020-12-15 | \n",
" 98 | \n",
" 123 | \n",
" 275.00 | \n",
"
\n",
" \n",
" 16 | \n",
" 60 | \n",
" 2020-12-16 | \n",
" 98 | \n",
" 120 | \n",
" 215.20 | \n",
"
\n",
" \n",
" 17 | \n",
" 60 | \n",
" 2020-12-17 | \n",
" 100 | \n",
" 120 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 18 | \n",
" 45 | \n",
" 2020-12-18 | \n",
" 90 | \n",
" 112 | \n",
" 304.68 | \n",
"
\n",
" \n",
" 19 | \n",
" 60 | \n",
" 2020-12-19 | \n",
" 103 | \n",
" 123 | \n",
" 323.00 | \n",
"
\n",
" \n",
" 20 | \n",
" 45 | \n",
" 2020-12-20 | \n",
" 97 | \n",
" 125 | \n",
" 243.00 | \n",
"
\n",
" \n",
" 21 | \n",
" 60 | \n",
" 2020-12-21 | \n",
" 108 | \n",
" 131 | \n",
" 364.20 | \n",
"
\n",
" \n",
" 22 | \n",
" 45 | \n",
" NaT | \n",
" 100 | \n",
" 119 | \n",
" 282.00 | \n",
"
\n",
" \n",
" 23 | \n",
" 60 | \n",
" 2020-12-23 | \n",
" 130 | \n",
" 101 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 24 | \n",
" 45 | \n",
" 2020-12-24 | \n",
" 105 | \n",
" 132 | \n",
" 246.00 | \n",
"
\n",
" \n",
" 25 | \n",
" 60 | \n",
" 2020-12-25 | \n",
" 102 | \n",
" 126 | \n",
" 334.50 | \n",
"
\n",
" \n",
" 26 | \n",
" 60 | \n",
" 2020-12-26 | \n",
" 100 | \n",
" 120 | \n",
" 250.00 | \n",
"
\n",
" \n",
" 27 | \n",
" 60 | \n",
" 2020-12-27 | \n",
" 92 | \n",
" 118 | \n",
" 241.00 | \n",
"
\n",
" \n",
" 28 | \n",
" 60 | \n",
" 2020-12-28 | \n",
" 103 | \n",
" 132 | \n",
" 304.68 | \n",
"
\n",
" \n",
" 29 | \n",
" 60 | \n",
" 2020-12-29 | \n",
" 100 | \n",
" 132 | \n",
" 280.00 | \n",
"
\n",
" \n",
" 30 | \n",
" 60 | \n",
" 2020-12-30 | \n",
" 102 | \n",
" 129 | \n",
" 380.30 | \n",
"
\n",
" \n",
" 31 | \n",
" 60 | \n",
" 2020-12-31 | \n",
" 92 | \n",
" 115 | \n",
" 243.00 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Duration Date Pulse Maxpulse Calories\n",
"0 60 2020-12-01 110 130 409.10\n",
"1 60 2020-12-02 117 145 479.00\n",
"2 60 2020-12-03 103 135 340.00\n",
"3 45 2020-12-04 109 175 282.40\n",
"4 45 2020-12-05 117 148 406.00\n",
"5 60 2020-12-06 102 127 300.00\n",
"6 60 2020-12-07 110 136 374.00\n",
"7 45 2020-12-08 104 134 253.30\n",
"8 30 2020-12-09 109 133 195.10\n",
"9 60 2020-12-10 98 124 269.00\n",
"10 60 2020-12-11 103 147 329.30\n",
"11 60 2020-12-12 100 120 250.70\n",
"12 60 2020-12-12 100 120 250.70\n",
"13 60 2020-12-13 106 128 345.30\n",
"14 60 2020-12-14 104 132 379.30\n",
"15 60 2020-12-15 98 123 275.00\n",
"16 60 2020-12-16 98 120 215.20\n",
"17 60 2020-12-17 100 120 300.00\n",
"18 45 2020-12-18 90 112 304.68\n",
"19 60 2020-12-19 103 123 323.00\n",
"20 45 2020-12-20 97 125 243.00\n",
"21 60 2020-12-21 108 131 364.20\n",
"22 45 NaT 100 119 282.00\n",
"23 60 2020-12-23 130 101 300.00\n",
"24 45 2020-12-24 105 132 246.00\n",
"25 60 2020-12-25 102 126 334.50\n",
"26 60 2020-12-26 100 120 250.00\n",
"27 60 2020-12-27 92 118 241.00\n",
"28 60 2020-12-28 103 132 304.68\n",
"29 60 2020-12-29 100 132 280.00\n",
"30 60 2020-12-30 102 129 380.30\n",
"31 60 2020-12-31 92 115 243.00"
]
},
"execution_count": 16,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df"
]
},
{
"cell_type": "code",
"execution_count": 18,
"id": "7888f644-60a5-41e2-bd9f-acf1f5e08f5d",
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"0 False\n",
"1 False\n",
"2 False\n",
"3 False\n",
"4 False\n",
"5 False\n",
"6 False\n",
"7 False\n",
"8 False\n",
"9 False\n",
"10 False\n",
"11 False\n",
"12 True\n",
"13 False\n",
"14 False\n",
"15 False\n",
"16 False\n",
"17 False\n",
"18 False\n",
"19 False\n",
"20 False\n",
"21 False\n",
"22 False\n",
"23 False\n",
"24 False\n",
"25 False\n",
"26 False\n",
"27 False\n",
"28 False\n",
"29 False\n",
"30 False\n",
"31 False\n",
"dtype: bool\n"
]
}
],
"source": [
"# remove duplicates row 11 & 12\n",
"print(df.duplicated())"
]
},
{
"cell_type": "code",
"execution_count": 19,
"id": "ff4ee9a2-dabb-4015-8b0c-5527f688bb21",
"metadata": {},
"outputs": [],
"source": [
"df.drop_duplicates(inplace = True)"
]
},
{
"cell_type": "code",
"execution_count": 20,
"id": "44165eb4-ab0c-4be0-92d6-4c8ccf2ff389",
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Duration | \n",
" Date | \n",
" Pulse | \n",
" Maxpulse | \n",
" Calories | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 60 | \n",
" 2020-12-01 | \n",
" 110 | \n",
" 130 | \n",
" 409.10 | \n",
"
\n",
" \n",
" 1 | \n",
" 60 | \n",
" 2020-12-02 | \n",
" 117 | \n",
" 145 | \n",
" 479.00 | \n",
"
\n",
" \n",
" 2 | \n",
" 60 | \n",
" 2020-12-03 | \n",
" 103 | \n",
" 135 | \n",
" 340.00 | \n",
"
\n",
" \n",
" 3 | \n",
" 45 | \n",
" 2020-12-04 | \n",
" 109 | \n",
" 175 | \n",
" 282.40 | \n",
"
\n",
" \n",
" 4 | \n",
" 45 | \n",
" 2020-12-05 | \n",
" 117 | \n",
" 148 | \n",
" 406.00 | \n",
"
\n",
" \n",
" 5 | \n",
" 60 | \n",
" 2020-12-06 | \n",
" 102 | \n",
" 127 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 6 | \n",
" 60 | \n",
" 2020-12-07 | \n",
" 110 | \n",
" 136 | \n",
" 374.00 | \n",
"
\n",
" \n",
" 7 | \n",
" 45 | \n",
" 2020-12-08 | \n",
" 104 | \n",
" 134 | \n",
" 253.30 | \n",
"
\n",
" \n",
" 8 | \n",
" 30 | \n",
" 2020-12-09 | \n",
" 109 | \n",
" 133 | \n",
" 195.10 | \n",
"
\n",
" \n",
" 9 | \n",
" 60 | \n",
" 2020-12-10 | \n",
" 98 | \n",
" 124 | \n",
" 269.00 | \n",
"
\n",
" \n",
" 10 | \n",
" 60 | \n",
" 2020-12-11 | \n",
" 103 | \n",
" 147 | \n",
" 329.30 | \n",
"
\n",
" \n",
" 11 | \n",
" 60 | \n",
" 2020-12-12 | \n",
" 100 | \n",
" 120 | \n",
" 250.70 | \n",
"
\n",
" \n",
" 13 | \n",
" 60 | \n",
" 2020-12-13 | \n",
" 106 | \n",
" 128 | \n",
" 345.30 | \n",
"
\n",
" \n",
" 14 | \n",
" 60 | \n",
" 2020-12-14 | \n",
" 104 | \n",
" 132 | \n",
" 379.30 | \n",
"
\n",
" \n",
" 15 | \n",
" 60 | \n",
" 2020-12-15 | \n",
" 98 | \n",
" 123 | \n",
" 275.00 | \n",
"
\n",
" \n",
" 16 | \n",
" 60 | \n",
" 2020-12-16 | \n",
" 98 | \n",
" 120 | \n",
" 215.20 | \n",
"
\n",
" \n",
" 17 | \n",
" 60 | \n",
" 2020-12-17 | \n",
" 100 | \n",
" 120 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 18 | \n",
" 45 | \n",
" 2020-12-18 | \n",
" 90 | \n",
" 112 | \n",
" 304.68 | \n",
"
\n",
" \n",
" 19 | \n",
" 60 | \n",
" 2020-12-19 | \n",
" 103 | \n",
" 123 | \n",
" 323.00 | \n",
"
\n",
" \n",
" 20 | \n",
" 45 | \n",
" 2020-12-20 | \n",
" 97 | \n",
" 125 | \n",
" 243.00 | \n",
"
\n",
" \n",
" 21 | \n",
" 60 | \n",
" 2020-12-21 | \n",
" 108 | \n",
" 131 | \n",
" 364.20 | \n",
"
\n",
" \n",
" 22 | \n",
" 45 | \n",
" NaT | \n",
" 100 | \n",
" 119 | \n",
" 282.00 | \n",
"
\n",
" \n",
" 23 | \n",
" 60 | \n",
" 2020-12-23 | \n",
" 130 | \n",
" 101 | \n",
" 300.00 | \n",
"
\n",
" \n",
" 24 | \n",
" 45 | \n",
" 2020-12-24 | \n",
" 105 | \n",
" 132 | \n",
" 246.00 | \n",
"
\n",
" \n",
" 25 | \n",
" 60 | \n",
" 2020-12-25 | \n",
" 102 | \n",
" 126 | \n",
" 334.50 | \n",
"
\n",
" \n",
" 26 | \n",
" 60 | \n",
" 2020-12-26 | \n",
" 100 | \n",
" 120 | \n",
" 250.00 | \n",
"
\n",
" \n",
" 27 | \n",
" 60 | \n",
" 2020-12-27 | \n",
" 92 | \n",
" 118 | \n",
" 241.00 | \n",
"
\n",
" \n",
" 28 | \n",
" 60 | \n",
" 2020-12-28 | \n",
" 103 | \n",
" 132 | \n",
" 304.68 | \n",
"
\n",
" \n",
" 29 | \n",
" 60 | \n",
" 2020-12-29 | \n",
" 100 | \n",
" 132 | \n",
" 280.00 | \n",
"
\n",
" \n",
" 30 | \n",
" 60 | \n",
" 2020-12-30 | \n",
" 102 | \n",
" 129 | \n",
" 380.30 | \n",
"
\n",
" \n",
" 31 | \n",
" 60 | \n",
" 2020-12-31 | \n",
" 92 | \n",
" 115 | \n",
" 243.00 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Duration Date Pulse Maxpulse Calories\n",
"0 60 2020-12-01 110 130 409.10\n",
"1 60 2020-12-02 117 145 479.00\n",
"2 60 2020-12-03 103 135 340.00\n",
"3 45 2020-12-04 109 175 282.40\n",
"4 45 2020-12-05 117 148 406.00\n",
"5 60 2020-12-06 102 127 300.00\n",
"6 60 2020-12-07 110 136 374.00\n",
"7 45 2020-12-08 104 134 253.30\n",
"8 30 2020-12-09 109 133 195.10\n",
"9 60 2020-12-10 98 124 269.00\n",
"10 60 2020-12-11 103 147 329.30\n",
"11 60 2020-12-12 100 120 250.70\n",
"13 60 2020-12-13 106 128 345.30\n",
"14 60 2020-12-14 104 132 379.30\n",
"15 60 2020-12-15 98 123 275.00\n",
"16 60 2020-12-16 98 120 215.20\n",
"17 60 2020-12-17 100 120 300.00\n",
"18 45 2020-12-18 90 112 304.68\n",
"19 60 2020-12-19 103 123 323.00\n",
"20 45 2020-12-20 97 125 243.00\n",
"21 60 2020-12-21 108 131 364.20\n",
"22 45 NaT 100 119 282.00\n",
"23 60 2020-12-23 130 101 300.00\n",
"24 45 2020-12-24 105 132 246.00\n",
"25 60 2020-12-25 102 126 334.50\n",
"26 60 2020-12-26 100 120 250.00\n",
"27 60 2020-12-27 92 118 241.00\n",
"28 60 2020-12-28 103 132 304.68\n",
"29 60 2020-12-29 100 132 280.00\n",
"30 60 2020-12-30 102 129 380.30\n",
"31 60 2020-12-31 92 115 243.00"
]
},
"execution_count": 20,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df"
]
},
{
"cell_type": "code",
"execution_count": 22,
"id": "3033c2a4-18f1-4fcd-be75-f71f95c9097f",
"metadata": {},
"outputs": [],
"source": [
"df.to_csv('cleaned.csv')"
]
},
{
"cell_type": "code",
"execution_count": null,
"id": "549ea6b3-3903-4b74-88ad-74c60e7d862e",
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3 (ipykernel)",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.10.8"
}
},
"nbformat": 4,
"nbformat_minor": 5
}