Pythonとのコンコード

あなたの目標は、分析するテキストファイルをユーザーに求めることです。あなたも提供されます ストップワードのファイル - ファイルを分析するときに無視されるワード。後 一致を作成し、例に示すように一致結果を表示する 以下の出力。一致の各単語について、次のように印刷します。

  • the word
  • the total number of occurrences
  • for each occurrence:
    • the line number in the file (the first line is line #1)
    • the local context. The local context is the original line with the specified word in all upper case.

これは私がこれまで持っているものです:

import string
file_str = raw_input("What file to analyze:")
file_obj = open(file_str)
for line in file_obj.readlines():
    line = line.strip()
    split_line = line.split()
    for word in split_line:
        word = word.lower()
        word = word.strip(string.punctuation)

私はそこからどこへ行くのか分からない!

0
まず、必要なデータ構造を分析することから始めます。どのように言葉を保存しますか?各単語について必要な情報をどのように保存しますか?次に、その情報をどのように収集するかを把握します。
追加された 著者 kindall,
ここ2日間でも同様の質問がありました。アーカイブを少し閲覧したいかもしれません。
追加された 著者 Sven Marnach,
あなたは何をしているつもりですか?
追加された 著者 millimoose,
4行目の下にあるすべてのコードをインデントします。どのようにして一致を定義しますか?
追加された 著者 Simon,
@同じ宿題について他の質問がありますが、彼らはOPへの答えの要素を台無しにするかもしれません。エミリーがもっと正確な方法で問題を定式化しようとするならば、これをSOの特別なボーナス練習として考えてみましょう:-)
追加された 著者 Simon,
私たちはtyyファイルを与えられていますが、その中にメインワードを数え、それを大文字にする必要があります。例出力:ファイルを分析します:itsy_bitsy_spider.txtファイルitsy_bitsy_spider.txtの一致:合計数:2 Line:1:ITSY Bitsyの蜘蛛が水の噴出口を這うLine:4:そしてITSY Bitsyの蜘蛛が再び吐き気を上げた!総数:1行:1:Itsy Bitsyスパイダーが吐水口を吐き出した:総数:2行:1:Itsy Bitsyスパイダーが水を這うSPOUT Line:4:Itsy Bitsyスパイダーがもう一度SPOUT!
追加された 著者 stackoverflow_user1,

1 答え

あなたが必要とするのは、外側のループの各反復でインクリメントするカウンタです。行番号に関する情報を入力する必要があるためです。

次に、次のステップは辞書を用意することです。ループ外

words = {}

単語が出現するたびに、それがすでに辞書のキーであるかどうかを確認します。

if word in words:

そうであれば、エントリを更新する

    word_info = words[word]
    word_info =//something changed
   //possibly you need this depending on the type of word_info
    words[word] = word_info

そうでない場合は、新しいエントリを作成します

else:
    word_info =//something
    words[word] = word_info

私はそれをあなたに任せて、word_infoがどのような価値があるべきかを理解する。

0
追加された
私たちはtyyファイルを与えられていますが、その中にメインワードを数え、それを大文字にする必要があります。例出力:ファイルを分析します:itsy_bitsy_spider.txtファイルitsy_bitsy_spider.txtの一致:合計数:2 Line:1:ITSY Bitsyの蜘蛛が水の噴出口を這うLine:4:そしてITSY Bitsyの蜘蛛が再び吐き気を上げた!総数:1行:1:Itsy Bitsyスパイダーが吐水口を吐き出した:総数:2行:1:Itsy Bitsyスパイダーが水を這うSPOUT Line:4:Itsy Bitsyスパイダーがもう一度SPOUT!
追加された 著者 stackoverflow_user1,