#include <iostream> #include<bits/stdc++.h> using namespace std; int main() { vector <int> v1 = {4, 8, 8, 8, 8, 8, 8}; vector <int> v2 = {4, 4, 8, 8, 8, 8, 8}; vector <int> v3 = {4, 4, 4, 8, 8, 8, 8}; do{ printf("CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj %d --k_proj %d --v_proj %d --o_proj %d --gate_proj %d --up_proj %d --down_proj %d\n", v1[0], v1[1], v1[2], v1[3], v1[4], v1[5], v1[6]); }while(next_permutation(v1.begin(), v1.end())); do{ printf("CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj %d --k_proj %d --v_proj %d --o_proj %d --gate_proj %d --up_proj %d --down_proj %d\n", v2[0], v2[1], v2[2], v2[3], v2[4], v2[5], v2[6]); }while(next_permutation(v2.begin(), v2.end())); do{ printf("CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj %d --k_proj %d --v_proj %d --o_proj %d --gate_proj %d --up_proj %d --down_proj %d\n", v3[0], v3[1], v3[2], v3[3], v3[4], v3[5], v3[6]); }while(next_permutation(v3.begin(), v3.end())); return 0; }
Standard input is empty
CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 4 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 4 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 4 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 4 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 4 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 4 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 4 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 4 --v_proj 8 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 4 --gate_proj 4 --up_proj 8 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 4 --gate_proj 8 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 4 --gate_proj 8 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 4 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 4 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 4 --o_proj 8 --gate_proj 8 --up_proj 4 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 4 --up_proj 4 --down_proj 8 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 4 --up_proj 8 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 4 --gate_proj 8 --up_proj 4 --down_proj 4 CUDA_VISIBLE_DEVICES=3 python run_custom_layer.py --q_proj 8 --k_proj 8 --v_proj 8 --o_proj 8 --gate_proj 4 --up_proj 4 --down_proj 4