मैं अजगर में नौसिखिया हूं, मैं अपने मामले के लिए स्टैक ओवरफ्लो में खोज करता हूं लेकिन मुझे तकनीकी उत्तर नहीं मिला। मेरे पास बड़ी संख्या में बीएस पंक्ति है।

मेरी समस्या इस प्रकार है, मेरे पास एक dataframe है:

df
BS          N
BS1 - BS5   1
BS2 - BS7   2
BS1 - BS9   2
BS9 - BS1   1

मैं स्वचालित रूप से नया डेटा बनाना चाहता हूं। मेरा अपेक्षित परिणाम इस प्रकार है:

New_BS  BS1 - BS5   BS2 - BS7   BS1 - BS9   BS9 - BS1   Total
BS1-2       1                       2                     3
BS2-3       1           2           2                     5
BS3-4       1           2           2                     5
BS4-5       1           2           2                     5
BS5-6                   2           2                     4
BS6-7                   2           2                     4
BS7-8                               2                     2
BS8-9                               2                     2
BS9-8                                            1        1
BS8-7                                            1        1
BS7-6                                            1        1
BS6-5                                            1        1
BS5-4                                            1        1
BS4-3                                            1        1
BS3-2                                            1        1
BS2-1                                            1        1

मेरी मदद करने के लिए अग्रिम धन्यवाद

0
Arief 2 जुलाई 2018, 04:27

1 उत्तर

सबसे बढ़िया उत्तर

खैर - यह कुल हैक है - लेकिन यह मजेदार था ...

import pandas as pd
import numpy as np

df = df_flat = pd.DataFrame({"BS": ['BS1 - BS5', 'BS2 - BS7', 'BS1 - BS9', 'BS9 - BS1'],
                   "N" : [1, 2, 2, 1]})

df = df.pivot(columns='BS',
              values='N')

df_flat = df_flat.pivot_table(
              columns='BS',
              values='N')

for column_name, column in zip(list(df), df):
    if int(column[2:3]) < int(column[8:9]):
        for stop in range(int(column[2:3]), int(column[8:9])):
            index = "BS" + str(stop) + "-" + str(stop + 1)
            if index not in list(df.index.values):
                df.loc[index] = np.nan
            df.loc[index, column] = df_flat.loc['N', column]
    else:
        for stop in range(int(column[2:3]), int(column[8:9]), -1):
            index = "BS" + str(stop) + "-" + str(stop - 1)
            if index not in list(df.index.values):
                df.loc[index] = np.nan
            df.loc[index, column] = df_flat.loc['N', column]

df['Total'] = df.sum(axis=1)

df = df.iloc[len(list(df_flat)):]

print(df.fillna(''))

उत्पादन

$ python bus.py
BS    BS1 - BS5 BS1 - BS9 BS2 - BS7 BS9 - BS1  Total
BS1-2         1         2                        3.0
BS2-3         1         2         2              5.0
BS3-4         1         2         2              5.0
BS4-5         1         2         2              5.0
BS5-6                   2         2              4.0
BS6-7                   2         2              4.0
BS7-8                   2                        2.0
BS8-9                   2                        2.0
BS9-8                                       1    1.0
BS8-7                                       1    1.0
BS7-6                                       1    1.0
BS6-5                                       1    1.0
BS5-4                                       1    1.0
BS4-3                                       1    1.0
BS3-2                                       1    1.0
BS2-1                                       1    1.0

इसमें सुधार करने के लगभग 1,000 तरीके हैं - लेकिन यह एक अच्छी शुरुआत है...

ध्यान दें कि डेटा सेट पर स्लाइसिंग एक बहुत ही महत्वपूर्ण बाधा है - - आपको इसे गतिशील बनाने के लिए वास्तव में इसे फिर से काम करना होगा।

1
Bill Armstrong 2 जुलाई 2018, 09:32