未来工作：

《Does it matter who pays back Technical Debt? An empirical study of self-fixed TD》IST
- 关注其如何收集数据；
- 开源数据集是何种情况；
- 从哪些角度进行分析；
- 模仿其中的实证研究、统计分析等做法，找到存在显著性差异的特征数据；
- 再依据差异的现象和特征，进一步提取特征、量化特征；
- 然后把这些特征放到ML模型当中去进行训练、优化；
《An Exploratory Study on Self-Fixed Software Vulnerabilities in OSS Projects》SANER
- 试着找出Vulnerabilities与SATD的共性；
- 将其与Self-Fix的工作联系起来；
关于Code-t5，RNN等文本分类的机器学习模型:
- 需要重点关注这些模型的基本思想、用途、操作过程、优势与区别、原因与动机等方面;
- 要是有必要的话，再去深入了解它们底层公式的实现情况;
- 可以到教学网站去拷贝代码，先跑通代码；
- 针对自己面临的问题去进行相应的改进；

SATD数据集采集